La simulation multiverselle propulse l’intelligence robotique
L'intelligence artificielle fait des pas de géant dans le domaine du langage, avec des modèles comme GPT qui bousculent déjà de nombreuses professions. Mais qu'en est-il de l'IA incarnée dans des robots physiques, capables d'interagir avec le monde réel ? Cette IA "robotique" progresse moins vite, faute de données d'entraînement suffisantes. Mais cela pourrait changer très rapidement grâce à de nouveaux outils de simulation multiverselle développés par Nvidia et Google.
Le défi des données pour l'IA robotique
Contrairement aux modèles de langage qui s'entraînent sur l'immense corpus de textes et d'images disponibles en ligne, les modèles d'IA contrôlant des robots manquent cruellement de données sur les interactions physiques dans le monde 3D. Collecter ces données dans le monde réel est long et coûteux. C'est pourquoi des entreprises comme Tesla ont déployé très tôt des véhicules bardés de caméras et capteurs, pour engranger un maximum de données et prendre une longueur d'avance sur les voitures autonomes.
Nvidia Cosmos et Google Deepmind à la rescousse
Pour débloquer la situation, Nvidia lance sa plateforme de simulation Cosmos, tandis que Google Deepmind annonce des projets similaires. L'idée : générer massivement des données d'entraînement synthétiques en simulant des mondes virtuels ultra-réalistes. À partir d'une seule situation réelle (comme une voiture roulant dans une rue), ces outils peuvent créer une multitude de variantes en modifiant des paramètres comme :
- L'heure, la météo, l'éclairage
- Le comportement des autres véhicules, piétons, animaux
- Les rebonds d'objets qui tombent
En rejouant chaque scénario des milliers de fois avec des variations, on obtient une quantité phénoménale de données d'entraînement couvrant une multitude de situations, y compris des cas rares impossibles à observer fréquemment dans la réalité.
Le moment "ChatGPT" pour la robotique arrive. Comme les grands modèles de langage, les modèles d'univers sont fondamentaux pour faire progresser les robots et véhicules autonomes.
– Jensen Huang, CEO de Nvidia
Des débouchés concrets
Nvidia revendique déjà l'adhésion de nombreux acteurs de la robotique et de la conduite autonome, comme Xpeng, Uber ou Wayve. De même, Google voit dans ces simulations une étape clé vers l'intelligence artificielle générale (AGI), avec des applications dans le raisonnement visuel, la planification robotique ou le divertissement interactif.
Grâce à ces simulations multiverselles, l'intelligence artificielle incarnée pourrait bientôt rattraper son retard sur l'IA linguistique, nous rapprochant toujours plus d'un futur où robots humanoïdes et véhicules autonomes seront une réalité quotidienne. Une perspective vertigineuse, porteuse d'immenses promesses mais aussi de défis éthiques et sociétaux majeurs, qu'il nous faudra affronter collectivement.