Microsoft a annoncé des mises à jour importantes pour Azure OpenAI Service, conçues pour aider ses plus de 60 000 clients à gérer les déploiements d'IA plus efficacement et à moindre coût. L'introduction des déploiements provisionnés en libre-service vise à rendre les processus de quota et de déploiement plus agiles, plus rapides à mettre sur le marché et plus économiques.

L'une des principales mises à jour est l'introduction de la tarification à l'heure pour les unités de débit provisionnées (PTU), permettant aux utilisateurs de créer des déploiements pour une durée minimale d'une heure à un tarif horaire fixe de 2 $ par unité et par heure. Ceci est idéal pour les scénarios de test ou les périodes de transition sans engagement à long terme.

De plus, Microsoft propose désormais des réservations Azure mensuelles et annuelles pour les déploiements provisionnés, offrant des économies de coûts significatives pour les environnements de production avec des volumes de requêtes stables. Les clients peuvent économiser jusqu'à 82 % ou 85 %, respectivement, par rapport aux tarifs horaires.

Les témoignages de réussite des clients, tels que Visier Solutions, mettent en évidence les avantages tangibles de ces mises à jour, notamment des temps de réponse améliorés, une stabilité accrue et une latence réduite.

En simplifiant les processus de déploiement et la gestion des coûts, Microsoft vise à donner à davantage de clients les moyens de tirer parti de la puissance d'Azure OpenAI Service pour créer leurs propres applications d'IA générative.