Microsoft lance ses dernières machines virtuelles Azure optimisées pour le supercalcul d'IA, la série ND H200 v5.
Alors que le paysage de l'IA évolue rapidement, le besoin d'une infrastructure évolutive et performante continue de croître de manière exponentielle. Les clients de Microsoft s'appuient sur l'infrastructure Azure AI pour développer des solutions innovantes basées sur l'IA, c'est pourquoi l'entreprise propose de nouveaux clusters de supercalculateurs d'IA basés sur le cloud, construits avec des machines virtuelles (VM) de la série Azure ND H200 v5. Ces VM sont désormais disponibles de manière générale et sont conçues pour gérer la complexité croissante des charges de travail d'IA avancées, de l'entraînement de modèles fondamentaux à l'inférence générative.
L'un des aspects les plus intéressants de la ND H200 v5 est sa capacité à résoudre le problème de goulot d'étranglement causé par la croissance de la puissance de calcul brute des GPU à un rythme beaucoup plus rapide que la mémoire et la bande passante mémoire associées. Les VM de la série ND H200 v5 offrent une augmentation significative de la capacité et de la bande passante de la mémoire à bande passante élevée (HBM), ce qui permet aux GPU d'accéder plus rapidement aux paramètres du modèle. Cela se traduit par une réduction de la latence globale des applications, ce qui est essentiel pour les applications en temps réel telles que les agents interactifs.
De plus, les VM ND H200 v5 peuvent accueillir des modèles de langage volumineux (LLM) plus complexes dans la mémoire d'une seule VM. Cela évite d'avoir à exécuter des tâches distribuées sur plusieurs VM, ce qui améliore les performances et réduit la complexité.
Enfin, la ND H200 v5 est pré-intégrée à des services Azure tels qu'Azure Batch, Azure Kubernetes Service, Azure OpenAI Service et Azure Machine Learning. Ces intégrations permettent aux entreprises de démarrer facilement avec les nouvelles VM, ce qui en fait une option attrayante pour les organisations qui cherchent à exploiter la puissance du supercalcul d'IA.