Runway s’impose dans la génération vidéo avec Gen-3 Alpha
Alors qu'OpenAI avait marqué les esprits en début d'année avec les impressionnantes vidéos générées par son modèle Sora, la start-up new-yorkaise Runway compte bien s'imposer comme un acteur majeur dans ce domaine très prometteur. Son nouveau modèle baptisé Gen-3 Alpha, premier d'une série, repousse encore les limites de ce que l'IA peut réaliser en termes de génération vidéo.
Gen-3 Alpha : un bond en avant pour la génération vidéo IA
Fruit d'un entraînement conjoint sur des millions d'images et de vidéos, Gen-3 Alpha inaugure une nouvelle architecture d'IA multimodale à grande échelle chez Runway. Les progrès sont notables en termes de fidélité, de cohérence et de fluidité des mouvements par rapport à la génération précédente Gen-2, sortie il y a seulement un an.
Ce modèle est conçu pour alimenter toute une gamme d'outils de création vidéo assistée par IA :
- Génération de vidéos à partir de texte ou d'images
- Contrôle avancé du mouvement, de la caméra, de la structure
- Fonctionnalités de "réalisation" pour affiner le style
Les possibilités offertes par Gen-3 Alpha sont vastes, avec des vidéos générées pouvant aller de 5 à 10 secondes. Un format idéal pour de nombreux cas d'usage créatifs et publicitaires.
Des personnages virtuels plus vrais que nature
Une des forces de ce nouveau modèle réside dans sa capacité à créer des personnages humains extrêmement expressifs et détaillés. Leurs actions, gestes et émotions paraissent naturels, ouvrant la voie à des narrations IA bluffantes de réalisme.
Gen-3 Alpha a été conçu pour interpréter un large éventail de styles et de terminologies cinématographiques.
Runway
De quoi envisager de produire des publicités ou des courts-métrages entièrement générés par IA, ou d'assister la création de manière inédite. Runway propose d'ailleurs de développer des versions sur-mesure de Gen-3 pour les acteurs des médias et du divertissement.
Dépasser les limites actuelles de l'IA générative
Si le modèle Sora d'OpenAI avait déjà placé la barre très haut avec des scènes d'une minute en 1080p, Runway compte aller encore plus loin. D'autres géants comme Google (Imagen Video) ou Meta (Make-A-Video) planchent également sur le sujet, mais l'approche multimodale choisie par la start-up semble particulièrement prometteuse.
Gen-3 Alpha sera publié avec un ensemble de garde-fous, dont un système de modération visuelle amélioré. Pas encore de date annoncée, mais nul doute que les démos impressionnantes continueront d'alimenter l'intérêt grandissant pour l'IA générative appliquée à la vidéo.
Une chose est sûre, la course à l'innovation fait rage dans ce domaine et Runway compte bien tirer son épingle du jeu face aux géants de la tech. Reste à voir comment ces outils révolutionnaires seront mis entre les mains des créateurs et révolutionneront industries créatives et médiatiques.