Google dévoile Gemini Omni Flash, son nouveau modèle d’IA capable de générer et modifier des vidéos à la voix

La Google I/O a été riche en annonces IA. Parmi toutes les nouveautés annoncées lors de cette conférence annuelle, la firme de Mountain View a levé le voile sur Gemini Omni Flash, un nouveau modèle d’IA de Gemini, conçu pour être multimodal.

Ce nouveau modèle a en effet la particularité de pouvoir créer du contenu à partir de n’importe quel type d’entrée. Vous pouvez ainsi lui soumettre des images, du texte, des fichiers audio ou vidéo, et créer ou modifier votre contenu à la volée simplement en discutant avec l’IA à voix haute. Gemini Omni Flash, premier de la famille Gemini Omni à être déployé par Google, se concentre principalement sur la création et l’édition de vidéos.

Un outil d’édition vidéo conversationnel

Avec Gemini Omni Flash, Google cherche à simplifier l’utilisation de l’IA générative. Ce nouveau modèle permet en effet de modifier vos vidéos simplement en discutant avec l’IA. Toutes les instructions que vous lui dictez s’ajoutent aux précédentes, tout en maintenant une cohérence avec le contexte de la scène générée.

Le premier résultat ne vous convient pas ? Dites simplement à Gemini Omni Flash ce qu’il faut changer. L’IA peut transformer le monde environnant créé dans une vidéo, modifier l’action, ajouter des personnages ou encore changer le comportement de l’un d’eux.

Outre l’utilisation des connaissances de Gemini (en matière de culture, d’histoire, de sciences, etc.) pour créer des vidéos cohérentes visuellement, Gemini Omni comprend la physique. Le modèle sait gérer la gravité, la cinétique et la dynamique des fluides pour fournir un résultat réaliste. Et pour vous permettre d’obtenir un résultat optimal, vous pourrez combiner les entrées, en fournissant, par exemple, une image pour un personnage, un fichier audio pour le rythme, ou encore une vidéo pour le mouvement.

S'abonner à 01net

Un outil qui mise sur la personnalisation et la sécurité

Générer des vidéos réalistes grâce à l’IA n’est pas sans danger. Bien consciente du problème que ce type de contenu peut poser, Google a pris les devants. Toutes les vidéos générées avec Omni Flash intègrent un filigrane numérique (SynthID) imperceptible grâce auquel il est très facile de vérifier si le contenu a été généré par une IA via une requête dans Google ou directement avec l’application Gemini.

Par ailleurs, les créateurs de contenu pourront, s’ils le souhaitent, créer leur propre double numérique, avec leur propre voix, pour générer des vidéos à leur effigie et qui sonnent comme eux.

Gemini Omni Flash est d’ores et déjà en cours de déploiement pour les abonnés Google AI Plus, Pro et Ultra dans l’appli Gemini et Google Flow. Les utilisateurs de YouTube Shorts ainsi que de l’application YouTube Create pourront également en profiter gratuitement.