Google Cloud a annoncé des mises à jour et des améliorations à ses modèles et à sa plateforme d'IA générative, Gemini et Vertex AI, afin d'aider les entreprises à passer de l'expérimentation à la production.

L'un des principaux aspects abordés a été la manière de maximiser les performances du modèle sans compromettre la latence et les coûts. Les modèles Gemini 1.5 Pro et Flash ont été mis à jour pour offrir des améliorations de qualité en mathématiques, en compréhension du contexte long et en vision. De plus, le prix de Gemini 1.5 Pro a été réduit de 50 % pour les jetons d'entrée et de sortie.

Imagen 3, un modèle de génération d'images, a également été amélioré avec une meilleure compréhension des invites, un meilleur suivi des instructions et une qualité photoréaliste. Parmi les autres mises à jour, citons la possibilité d'insérer ou de supprimer rapidement des objets et d'effectuer des changements d'arrière-plan, ainsi que de nouvelles fonctionnalités de personnalisation puissantes.

Pour répondre aux préoccupations en matière de fiabilité, Google Cloud a introduit de nouvelles fonctionnalités dans Vertex AI, notamment la génération contrôlée, qui permet un contrôle précis des sorties de l'IA, et Prompt Optimizer, qui aide à améliorer les performances du modèle.

En outre, Google Cloud a réaffirmé son engagement envers une approche "Votre IA, à votre façon" en proposant des options de déploiement de l'IA flexibles, notamment des options de résidence des données pendant le traitement du ML.

Dans l'ensemble, ces mises à jour visent à doter les entreprises des outils et des technologies nécessaires pour déployer des solutions d'IA générative à grande échelle en toute confiance.