Amazon Web Services (AWS) a annoncé la disponibilité générale d'Amazon Elastic Kubernetes Service (Amazon EKS) Auto Mode, une nouvelle fonctionnalité permettant de simplifier la gestion des clusters Kubernetes pour le calcul, le stockage et la mise en réseau, du provisionnement à la maintenance continue en un seul clic. Cela permet une plus grande agilité, des performances accrues et une meilleure rentabilité en éliminant les frais généraux opérationnels liés à la gestion de l'infrastructure de cluster nécessaire à l'exécution d'applications Kubernetes de niveau production à grande échelle sur AWS.
Les clients choisissent Amazon EKS pour les normes ouvertes et la portabilité de Kubernetes, combinées à la sécurité, à l'évolutivité et à la disponibilité du cloud AWS. Bien que Kubernetes offre aux utilisateurs expérimentés un contrôle approfondi sur les opérations des applications, certains clients trouvent la gestion des composants requis pour les applications Kubernetes de niveau production complexe et laborieuse.
EKS Auto Mode automatise la gestion des clusters sans nécessiter une expertise approfondie de Kubernetes. Il sélectionne les instances de calcul optimales, met à l'échelle les ressources de manière dynamique, optimise en permanence les coûts, gère les modules complémentaires principaux, corrige les systèmes d'exploitation et s'intègre aux services de sécurité AWS. AWS étend sa responsabilité opérationnelle dans EKS Auto Mode par rapport à l'infrastructure gérée par le client dans les clusters EKS. En plus du plan de contrôle EKS, AWS configure, gère et sécurise l'infrastructure AWS dans les clusters EKS requis pour l'exécution des applications.
Cela permet aux utilisateurs de démarrer rapidement, d'améliorer les performances et de réduire les frais généraux, ce qui leur permet de se concentrer sur la création d'applications qui stimulent l'innovation plutôt que sur les tâches de gestion des clusters. EKS Auto Mode réduit également l'effort requis pour acquérir et exécuter des instances accélérées par GPU rentables, garantissant ainsi que les charges de travail d'IA générative disposent de la capacité dont elles ont besoin quand elles en ont besoin.