Google ne cesse d'élargir les horizons de sa technologie d'intelligence artificielle. Lors de sa conférence Google I/O du 19 mai, l'entreprise a révélé Gemini Omni Flash, qui promet de révolutionner la façon dont les utilisateurs créent et modifient des vidéos en trés peu de temps.
"Gemini Omni Flash est un modèle capable de créer n’importe quoi à partir de n’importe quel type d’entrée", témoigne Google dans son communiqué.
Ce nouveau modèle représente une avancée majeure par rapport à son prédécesseur, Nano Banana, car il intègre des capacités de création vidéo. Selon Google, "nous prendrons en charge d'autres formats de sortie, tels que l'image et l'audio" à l'avenir.
Un outil polyvalent pour tous
Les utilisateurs ont la possibilité d'utiliser plusieurs types d'entrées simultanément, qu'il s'agisse d'une vidéo, d'une image, d'un texte ou d'un audio, afin de générer des vidéos de haute qualité. Les modifications peuvent s'effectuer simplement grâce à des instructions en langage naturel, permettant des ajustements sur la scène, tels que le décor, les personnages ou même l'angle de vue.
"Vos personnages restent cohérents, et la scène se souvient de ce qui s’est passé auparavant", souligne Google.
Contrairement à d'autres modèles d'IA, Gemini Omni se distingue par sa capacité à maintenir une continuité visuelle entre les différentes modifications, adaptant ses reproductions grâce à sa compréhension des lois physiques du monde réel. Cela garantit une cohérence dans la dynamique des scènes produites.
Des vidéos explicatives à portée de main
Au-delà des simples créations vidéo, Gemini Omni se révèle aussi être un outil de vulgarisation. Il peut, par exemple, réaliser des vidéos explicatives à partir de consignes écrites. De plus, Google envisage d'introduire des vidéos générées à partir d'avatars numériques, un projet qui permettra aux utilisateurs de créer des vidéos avec leur propre voix.
Cette annonce s'accompagne de préoccupations grandissantes concernant l'usage de l'IA générative. OpenAI a par exemple suspendu certaines fonctionnalités par rapport à son modèle Sora après des abus liés à la création de contenus trompeurs. Ainsi, Google intègre le système SynthID pour garantir l'authenticité des vidéos produites par Gemini Omni, permettant leur traçabilité via Google Search et Chrome.
Gemini Omni Flash sera déployé dès aujourd’hui pour les abonnés Google AI Plus, Pro et Ultra, tout en étant accessible gratuitement dans Youtube Shorts et l’application Youtube Create cette semaine. L’ouverture aux développeurs via son API est aussi prévue dans les semaines suivantes.







