
Google dévoile Veo, un modèle IA générant des vidéos réalistes
Imaginez un monde où créer du contenu vidéo de qualité ne nécessiterait que quelques mots ou une simple image. C'est la promesse de Veo, le nouveau modèle d'intelligence artificielle dévoilé par Google, capable de générer des vidéos réalistes à partir de textes ou d'images. Une avancée majeure qui pourrait bien révolutionner la production vidéo.
Veo, le modèle d'IA générative texte-vidéo et image-vidéo
Développé par les équipes de DeepMind, filiale spécialisée en IA de Google, Veo s'appuie sur des années de recherche en vidéo générative. Le modèle combine différentes architectures telles que Transformer, Gemini et des modèles antérieurs comme Imagen-Video, Phenaki ou encore VideoPoet.
La force de Veo réside dans sa capacité à générer des vidéos en haute définition (1080p) à partir de commandes textuelles ou visuelles. Il peut s'adapter à différents styles cinématographiques et visuels selon les requêtes des utilisateurs. Mieux encore, il est capable de suivre une série d'instructions pour produire une vidéo cohérente.
L'alliance de l'IA et de la création vidéo
Avec Veo, Google espère démocratiser la production vidéo en la rendant plus rapide, moins coûteuse et accessible aux non-initiés. Des entreprises comme l'agence de voyages en ligne Agoda utilisent déjà le modèle pour prototyper rapidement des publicités vidéo :
"Nous explorons les capacités de génération de médias de l'IA Google Cloud, utilisant Imagen pour créer des visuels uniques de destinations de rêve dans divers styles. Ces images sont ensuite animées sous forme de vidéos avec la technologie image-to-video de Veo. Ces technologies ont le potentiel de rationaliser notre processus de création de contenu de jours à heures."
– Matteo Frigerio, Chief Marketing Officer chez Agoda
D'autres entreprises comme Honor, Mondelez, Quora ou WPP ont déjà adopté Imagen 3, le modèle de génération d'images texte-image de Google, pour leurs campagnes publicitaires. L'arrivée de Veo ouvre de nouvelles perspectives pour enrichir leurs contenus avec de la vidéo.
Imagen 3 et Veo, des modèles IA responsables
Conscient des risques liés à l'IA générative, Google a intégré des garde-fous dans Veo et Imagen 3 pour prévenir les contenus préjudiciables. Les deux modèles utilisent également le filigrane numérique SynthID développé par DeepMind, permettant d'identifier les médias générés par IA.
De plus, Google propose une indemnité à ses clients utilisant ces services d'IA générative afin de les protéger contre d'éventuels problèmes de copyright.
Vers une révolution de la création vidéo ?
Avec Veo, Google franchit un cap important dans l'IA générative appliquée à la vidéo. En simplifiant et accélérant la production de contenu vidéo, le géant du web pourrait bien démocratiser ce média auprès des entreprises et particuliers.
Reste à savoir comment cette technologie sera accueillie par les professionnels de l'audiovisuel et quelles seront ses applications concrètes. Une chose est sûre, Veo marque une étape clé dans la convergence entre intelligence artificielle et création vidéo, ouvrant de nouvelles perspectives passionnantes pour l'avenir du média roi.