AWS et AI21 Labs ont annoncé la disponibilité de la nouvelle famille de modèles de langage étendus (LLM) Jamba 1.5 d'AI21 Labs dans Amazon Bedrock. Ces modèles représentent une avancée significative dans les capacités de traitement du langage à long contexte, offrant vitesse, efficacité et performance dans un large éventail d'applications.
Les modèles Jamba 1.5 s'appuient sur une architecture hybride unique qui combine l'architecture de modèle Transformer à la technologie de modèle d'espace d'états structuré (SSM). Cette approche innovante permet aux modèles Jamba 1.5 de gérer des fenêtres de contexte longues jusqu'à 256 000 jetons, tout en conservant les caractéristiques de haute performance des modèles Transformer traditionnels.
Parmi les principaux atouts des modèles Jamba 1.5, citons :
* Gestion du contexte long : avec une longueur de contexte de 256 000 jetons, les modèles Jamba 1.5 peuvent améliorer la qualité des applications d'entreprise, telles que la synthèse et l'analyse de documents volumineux, ainsi que les workflows d'agents et RAG.
* Multilingue : prise en charge de l'anglais, de l'espagnol, du français, du portugais, de l'italien, du néerlandais, de l'allemand, de l'arabe et de l'hébreu.
* Convivialité pour les développeurs : prise en charge native de la sortie JSON structurée, de l'appel de fonctions et capacité à digérer les objets de documents.
* Vitesse et efficacité : AI21 a mesuré les performances des modèles Jamba 1.5 et a partagé que les modèles démontrent une inférence jusqu'à 2,5 fois plus rapide sur des contextes longs que d'autres modèles de tailles comparables.
Les modèles Jamba 1.5 sont parfaits pour des cas d'utilisation tels que l'analyse de documents appariés, l'analyse de conformité et la réponse aux questions pour les documents longs. Ils peuvent facilement comparer des informations provenant de sources multiples, vérifier si des passages répondent à des directives spécifiques et gérer des documents très longs ou complexes.
La famille de modèles Jamba 1.5 d'AI21 Labs est généralement disponible dès aujourd'hui dans Amazon Bedrock dans la région USA Est (Virginie du Nord) d'AWS.
Je pense que ces modèles représentent un pas en avant significatif dans le domaine du traitement du langage. La capacité à gérer des contextes longs ouvre un large éventail de nouvelles possibilités pour les développeurs et les entreprises. Je suis impatient de voir quelles applications innovantes seront développées à l'aide de ces modèles.