Fireworks.ai, une start-up spécialisée dans l'IA générative, a lancé le moteur d'inférence le plus rapide et le plus efficace à ce jour. L'entreprise s'appuie sur des systèmes d'IA composés, qui remplacent les modèles d'IA uniques traditionnels par plusieurs modèles interactifs. Fireworks.ai s'est associé à Google Cloud et à d'autres partenaires comme NVIDIA pour fournir des solutions rentables et évolutives. Google Cloud aide Fireworks.ai à traiter plus de 140 milliards de jetons par jour avec un temps de disponibilité de l'API de 99,99 %. Fireworks.ai utilise également les services Google Cloud tels que Cloud Pub/Sub, Cloud Functions, Cloud Monitoring et BigQuery pour optimiser les performances et réduire les coûts. Grâce à ce partenariat, Fireworks.ai a pu offrir une latence 4 fois inférieure et un débit 4 fois supérieur par rapport aux services hébergés concurrents. Fireworks.ai souligne l'importance de l'accès open source à l'IA et travaille avec Google Cloud pour permettre à un plus grand nombre d'entreprises de tirer profit des utilisations innovantes de l'IA générative.
Fireworks.ai et Google Cloud : au service de l'innovation en matière d'IA générative
Google Cloud