Alibaba défie OpenAI avec son modèle ouvert QwQ-32B-Preview
Alors que la course à l'intelligence artificielle s'intensifie, un nouvel acteur de poids vient de faire une entrée remarquée. Alibaba, le géant chinois du e-commerce, dévoile en effet QwQ-32B-Preview, un modèle de raisonnement IA destiné à rivaliser avec les modèles o1 d'OpenAI. Mais QwQ-32B-Preview a un atout de taille : il est open source, ouvrant ainsi de nouvelles perspectives pour la recherche en IA.
QwQ-32B-Preview, un modèle IA capable de raisonnement
Développé par l'équipe Qwen d'Alibaba, QwQ-32B-Preview est un modèle dit de "raisonnement", capable de traiter des requêtes allant jusqu'à 32 000 mots. Avec ses 32,5 milliards de paramètres, il surpasse les modèles o1-preview et o1-mini d'OpenAI sur certains benchmarks comme AIME et MATH.
Concrètement, QwQ-32B-Preview est capable de résoudre des énigmes logiques et de répondre à des questions mathématiques relativement complexes grâce à ses capacités de raisonnement. Il planifie ses actions et s'auto-vérifie pour éviter certains écueils typiques des IA.
Les limites de QwQ-32B-Preview
Alibaba reconnaît cependant certaines limites à son modèle. QwQ-32B-Preview peut ainsi changer de langue de façon inattendue, se retrouver bloqué dans des boucles ou sous-performer sur des tâches nécessitant un "raisonnement de bon sens".
De plus, en tant qu'entreprise chinoise, Alibaba doit se plier aux exigences des régulateurs. Son IA évite donc soigneusement certains sujets politiques sensibles, comme le statut de Taïwan ou les événements de Tiananmen.
Un modèle IA "ouvert", mais pas totalement
Si QwQ-32B-Preview est présenté comme un modèle "ouvert", disponible sous licence Apache 2.0, tous ses composants n'ont pas été divulgués. Impossible donc de le répliquer ou d'avoir une pleine visibilité sur son fonctionnement interne.
Il existe un continuum dans l'"ouverture" des modèles IA, allant de l'accès par API uniquement à la divulgation complète du modèle, des poids et des données. QwQ-32B-Preview se situe quelque part au milieu.
Le "test-time compute", une nouvelle approche prometteuse
QwQ-32B-Preview s'appuie sur une approche émergente appelée test-time compute ou inference compute. Celle-ci consiste à donner plus de temps de calcul aux modèles pour réaliser leurs tâches, ce qui sous-tend les modèles o1 d'OpenAI et maintenant QwQ-32B-Preview d'Alibaba.
Cette approche semble prometteuse à l'heure où les lois d'échelle, qui prédisaient une amélioration continue des performances en augmentant les données et la puissance de calcul, sont remises en question. Google mise d'ailleurs aussi sur cette piste, avec une équipe dédiée d'environ 200 personnes.
Alibaba, un sérieux challenger pour OpenAI ?
Avec QwQ-32B-Preview, Alibaba prouve sa capacité à développer des modèles IA de pointe, capables de rivaliser avec ceux des leaders occidentaux comme OpenAI. Son approche open source, même partielle, pourrait en outre stimuler la recherche.
Reste à voir si les limitations imposées par le cadre réglementaire chinois ne freineront pas le géant de l'e-commerce dans la course à l'IA. Une chose est sûre : la concurrence s'annonce rude et passionnante dans le domaine de l'intelligence artificielle !