En bref / Points clés
Le jeu de bonneteau de Veo
La conférence de Google I/O a présenté le puissant modèle Omni, mais a laissé une omission flagrante : aucune mention de Veo, l'IA de génération vidéo précédemment très médiatisée. Les observateurs ont immédiatement remis en question la disparition des outils vidéo dédiés de Google, qui avaient suscité un engouement considérable avant l'événement. Cette absence notable a déclenché un mystère central concernant la stratégie évolutive de Google en matière d'IA.
Josh Woodward, vice-président de Google pour Labs, Gemini et AI Studio, a clarifié la situation par la suite. Il a indiqué qu'Omni englobe fondamentalement Veo, expliquant qu'Omni est « tout ». Cette décision stratégique vise à combattre la prolifération croissante des noms chez Google, en consolidant ses nombreuses marques d'IA sous une bannière plus unifiée. Le modèle Omni actuel, par exemple, utilise déjà une variante de Veo pour ses capacités de génération et d'édition vidéo, alimenté par Gemini 3.5 Flash.
Pour l'avenir, Google a confirmé que Omni Pro sera lancé dans les prochains mois. Ce modèle de nouvelle génération très attendu promet des améliorations substantielles de ses capacités vidéo. Les initiés de l'industrie croient largement qu'Omni Pro représente le successeur puissant et axé sur la vidéo qui aurait été précédemment lancé sous le nom de Veo 4, s'alignant sur la convention de dénomination simplifiée de Google.
Pas un générateur, c'est un compositeur
Logan Kilpatrick, de Google DeepMind, offre une perspective clarificatrice : Omni fonctionne moins comme une IA générative pure et plus comme un « AI After Effects ». Cette analogie souligne sa force principale dans l'édition, le remixage et la composition de médias existants, déplaçant l'accent de la création brute vers la manipulation intelligente.
Omni fonctionne actuellement sur l'efficace Gemini 3.5 Flash, utilisant une variante de Veo pour ses capacités vidéo. Cependant, sa pleine puissance sera débloquée avec la sortie imminente du plus robuste Gemini 3.5 Pro, prévue pour les prochains mois, promettant des améliorations substantielles pour tous les types de médias.
Les premières démonstrations révèlent l'intelligence d'édition unique d'Omni. Un cas d'utilisation convaincant implique la transformation d'une capture d'écran statique de Google Maps en une séquence animée dynamique, sensible au contexte, avec des indications étape par étape. Omni ne se contente pas d'animer ; il comprend la scène, manipulant intelligemment les éléments pour créer un récit visuel cohérent et complexe.
Ce compositeur de médias sophistiqué intègre diverses entrées en sorties fluides, offrant un contrôle inégalé sur les séquences, images et audio existants. Google positionne Omni comme une nouvelle couche puissante pour construire, manipuler et améliorer les médias IA, offrant aux créateurs des outils qui vont au-delà de la simple génération.
Les trésors cachés de Google
Au-delà de la fanfare d'Omni, Google I/O a également dévoilé une suite de fonctionnalités d'IA discrètement puissantes, signalant un changement significatif dans les flux de travail des créateurs. Ces « trésors cachés » promettent de redéfinir la manière dont les utilisateurs interagissent avec l'IA générative et s'appuient sur elle.
Des mises à jour radicales de Flow permettent aux créateurs de construire des outils vidéo IA personnalisés à partir de zéro. Cette capacité va au-delà des simples invites, permettant aux utilisateurs de « vibe-coder » des effets et des fonctionnalités uniques, les transformant ainsi en architectes de leurs propres processus génératifs sur mesure.
Le Genie 3 de Google présente un potentiel de "Holodeck" auparavant confiné à la science-fiction. S'intégrant directement à Google Street View, Genie 3 peut désormais générer des mondes 3D interactifs et jouables dérivés de n'importe quel lieu du monde réel. Imaginez explorer une recréation virtuelle de la rue de votre enfance, rendue avec une fidélité sans précédent.
Des démos multijoueurs en phase précoce laissent entrevoir l'avenir expansif de Genie. Ces environnements générés peuvent être peuplés d'agents IA sophistiqués, jetant les bases de simulations complexes. Cette vision dépasse le simple jeu, suggérant des applications dans l'urbanisme, la formation virtuelle et les expériences narratives dynamiques. Les révélations discrètes de Google lors de l'I/O laissent présager un avenir vaste, profondément intéressant et peut-être sous-exploité.
La nouvelle pile de créateurs
Les annonces de Google à l'I/O ont révélé une stratégie cohérente, et non des modèles disparates. Omni sert de moteur central d'édition et de compositing, s'intégrant à Flow pour permettre aux créateurs de construire des outils vidéo IA personnalisés à partir de zéro, en "vibe-codant" efficacement des effets uniques. En complément, Genie est dédié à la création de mondes immersifs et Lyria à la génération audio IA sophistiquée, formant un écosystème vaste et interconnecté pour les utilisateurs avancés.
Cela représente un profond changement de paradigme. Google dépasse la course au "meilleur" générateur autonome, se concentrant plutôt sur une intégration profonde des flux de travail. L'entreprise construit une couche fondamentale où les créateurs peuvent construire *avec* l'IA, et non simplement la solliciter. Cela permet un contrôle granulaire et une personnalisation, passant des grandes lignes à l'artisanat numérique complexe.
Les créateurs font face à un nouvel impératif. L'avenir ne consiste pas à identifier un générateur supérieur unique ; il s'agit de maîtriser une suite complète d'outils interopérables. Cette approche offre un contrôle sans précédent sur le processus créatif, permettant aux artistes de sculpter les médias avec une précision auparavant inimaginable. Google a discrètement lancé ses meilleurs outils vidéo IA, et ne vous a pas révélé l'étendue complète de cette vision intégrée.
Foire aux questions
Qu'est-ce que le modèle Omni de Google ?
Omni est la nouvelle IA multimodale de Google conçue pour gérer diverses entrées et sorties. Pour la vidéo, elle utilise une variante de Veo, la positionnant comme un "AI After Effects" axé sur l'édition avancée, le remixage et le compositing plutôt que sur la simple génération.
Omni remplace-t-il l'IA Veo de Google ?
Effectivement, oui. Des sources internes suggèrent qu'Omni est un rebranding stratégique visant à consolider les outils IA de Google. Le prochain Omni Pro est probablement ce qui aurait été nommé Veo 4, signalant une nouvelle direction sous l'égide d'Omni.
En quoi Omni est-il différent des autres outils vidéo IA ?
Alors que d'autres se concentrent sur la génération de texte en vidéo, la force d'Omni réside dans ses capacités d'édition. Il est conçu pour les créateurs qui ont besoin d'un contrôle granulaire pour remixer, composer et manipuler des séquences existantes avec une conscience contextuelle.
Quels autres outils IA 'cachés' Google a-t-il révélés ?
Parallèlement à Omni, Google a discrètement mis à jour Flow pour permettre aux utilisateurs de créer des outils vidéo personnalisés, a connecté son modèle mondial Genie 3 à Google Street View pour la création de mondes interactifs, et a étendu sa plateforme audio IA Lyria.