Kyutai, la startup française qui révolutionne l’IA vocale
Un nouvel acteur français vient bousculer le monde de l'intelligence artificielle. Kyutai, le laboratoire de recherche ouverte lancé fin 2023 par Iliad, CMA CGM et Schmidt Futures, a développé un assistant vocal surpuissant baptisé Moshi. Capable de générer de la voix et de transcrire en temps réel en anglais, il s'appuie sur le modèle de langage multimodal maison Helium et ses 7 milliards de paramètres.
Kyutai mise sur des chercheurs de renom pour innover dans l'IA vocale
Pour créer Moshi, la startup Kyutai a réuni des pointures comme Neil Zeghidour, créateur de MusicLM chez Google, et Alexandre Défossez de MusicGen chez Meta. Leur but : repousser les limites de l'IA conversationnelle et faire mieux qu'OpenAI et son ChatGPT.
L'investissement est dérisoire par rapport aux outils développés à date.
Xavier Niel, co-fondateur de Kyutai
Un LLM compact et multimodal nommé Helium
La prouesse de Kyutai repose sur Helium, son grand modèle de langage relativement compact de 7 milliards de paramètres. Il intègre des données textuelles et audio provenant en grande partie du web pour générer un assistant aux capacités vocales étendues :
- Comprendre et répondre naturellement à l'oral
- Générer de la voix synthétique en temps réel
- Transcrire automatiquement la parole en texte
- Prédire et poursuivre des séquences audio
La sécurité, un défi à relever pour les acteurs de l'IA
Si Kyutai semble en avance, la course à l'IA générative ne fait que commencer. Des géants comme Nvidia ou Google investissent des milliards, pendant qu'OpenAI doit gérer les failles de sécurité révélées sur ChatGPT. La protection des modèles et données d'entraînement sera cruciale dans cette compétition mondiale effrénée.
La France, nouveau terrain de jeu de l'IA conversationnelle
Avec des pépites comme Kyutai, la France entend bien peser dans la bataille de l'IA vocale. Sa créativité et son écosystème dynamique attirent les talents pour développer les solutions du futur. Nul doute que d'autres acteurs tricolores réservent de belles surprises pour révolutionner la manière dont nous interagissons avec la technologie, au bureau comme à la maison.