Intel mise sur l’IA générative avec Xeon 6 et Gaudi 3
Qui aurait parié qu'Intel, le géant des semi-conducteurs en pleine tourmente, reviendrait aussi vite dans la course à l'IA générative ? C'est pourtant ce que laisse présager le lancement de ses nouveaux processeurs Xeon 6 et accélérateurs Gaudi 3, spécialement conçus pour propulser les charges de travail d'IA les plus gourmandes. Une annonce qui tombe à pic, alors que la demande en puissance de calcul adaptée à l'IA générative explose.
Les Xeon 6 musculent l'IA des serveurs
Avec jusqu'à 2 fois plus de performances que leurs prédécesseurs, les CPU Xeon de 6e génération n'y vont pas de main morte. Intel a misé sur un plus grand nombre de cœurs, une bande passante mémoire doublée et des capacités d'accélération IA directement intégrées dans chaque cœur. De quoi booster significativement les performances des charges de travail d'IA générative :
- Jusqu'à 2,3 fois plus de performances pour les chatbots basés sur Llama 3-8B
- Jusqu'à 2,4 fois plus de performances de résumé et 1,68 fois plus de perf/watt vs Xeon de 5e génération
- Jusqu'à 3,08 fois plus de performances de compression sur Llama2-7B
Des chiffres prometteurs, obtenus sur une configuration musclée comprenant 96 coeurs, 500W de TDP et 1536 Go de RAM. De quoi permettre aux entreprises de déployer des applications d'IA générative plus performantes sur leurs serveurs.
Gaudi 3 : l'arme d'Intel pour la bataille de l'IA générative
La pièce maîtresse de l'arsenal IA d'Intel se nomme Gaudi 3. Ces accélérateurs dédiés, dévoilés en avant-première lors du dernier Vision Event, sont spécialement optimisés pour l'entraînement et l'inférence des modèles d'IA générative géants :
- 64 cœurs de TPC et 8 moteurs de multiplication matricielle pour booster les calculs des réseaux de neurones
- 128 Go de HBM2e pour l'entraînement et l'inférence des modèles les plus gourmands en mémoire
- 24 ports Ethernet 200 GbE pour une mise en cluster ultra-scalable
Cerise sur le gâteau, les Gaudi 3 sont compatibles de manière transparente avec les principaux frameworks d'IA comme PyTorch et les modèles pré-entraînés de Hugging Face. De quoi accélérer et simplifier le déploiement de l'IA générative pour les entreprises.
Un écosystème IA complet
Pour compléter son offre matérielle, Intel muscle aussi ses services et logiciels d'IA :
- SeekrFlow, une plateforme IA de bout en bout pour le développement d'applications basées sur l'IA
- Mise à jour du logiciel Intel Gaudi et ajout de notebooks Jupyter pré-configurés avec tous les outils nécessaires
- Tiber Developer Cloud pour tester en avant-première les Xeon 6 et Gaudi 3
Intel s'appuie également sur un solide réseau de partenaires pour déployer ses solutions IA. Des géants du cloud comme IBM qui proposeront les Gaudi 3 en tant que service, aux équipementiers comme Dell ou Supermicro qui intégreront les Xeon 6 et Gaudi 3 dans des systèmes clé en main. L'objectif : démocratiser l'accès à l'IA générative auprès des entreprises de toutes tailles.
La demande d'IA entraîne une transformation massive du centre de données, et l'industrie demande un choix de matériel, de logiciels et d'outils de développement.
– Justin Hotard, vice-président exécutif d'Intel et directeur général du Data Center and AI Group
En proposant une offre complète allant du matériel au logiciel en passant par les services, Intel entend bien se tailler une place de choix sur le marché ultra-concurrentiel de l'IA générative. Reste à savoir si cela sera suffisant pour combler son retard sur les leaders du secteur comme Nvidia. Une chose est sûre : la bataille ne fait que commencer, et Intel compte bien en être l'un des protagonistes majeurs !