Google Cloud a annoncé que Google Kubernetes Engine (GKE) prend désormais en charge jusqu'à 65 000 nœuds, lui permettant de gérer des modèles d'IA massifs à des billions de paramètres. À mesure que l'IA générative évolue, le besoin d'une puissance de calcul immense pour entraîner ces modèles s'intensifie. GKE offre désormais une échelle 10 fois supérieure à celle des deux autres plus grands fournisseurs de cloud public, permettant aux clients de réduire le temps d'entraînement des modèles ou de les mettre à l'échelle à plusieurs billions de paramètres. Cette expansion permet également d'exécuter cinq tâches dans un seul cluster, chacune correspondant à l'échelle du précédent record du monde de Google Cloud pour la plus grande tâche d'entraînement pour les LLM. Des clients comme Anthropic, une société de recherche et de sécurité en IA, ont salué ces développements. Techniquement, GKE passe de etcd open source, un magasin de valeurs-clés distribué, à un nouveau magasin de valeurs-clés plus robuste basé sur Spanner, la base de données distribuée de Google. Ce changement inaugurera de nouveaux niveaux de fiabilité pour les utilisateurs de GKE, améliorant la latence des opérations de cluster. De plus, grâce à une refonte majeure de l'infrastructure GKE gérant le plan de contrôle Kubernetes, GKE s'adapte désormais beaucoup plus rapidement. Google Cloud maintient également son engagement envers l'open source, garantissant que toutes les optimisations et améliorations nécessaires à une telle échelle font partie du noyau open source de Kubernetes.