Passer au contenu

Une IA de DeepMind est capable d’imaginer un monde en 3D d’après de simples photos

Après avoir maîtrisé le Go, l’intelligence artificielle de Google apprend à modéliser des mondes en 3D à partir d’images en 2D. Son fonctionnement nous rapproche un peu plus d’intelligence capables d’apprendre seules.

DeepMind règne sur le jeu de Go, avec AlphaGo, son intelligence artificielle. La filiale d’Alphabet, racheté en 2014 par Google, s’offre désormais une capacité de représentation de l’espace tridimensionnelle.
Après avoir appris annihilé toute résistance humaine dans le jeu millénaire, le super cerveau anglais (le siège est à Londres) défraye encore la chronique en devenant la première intelligence artificielle à être capable de modéliser une scène entière et ses composants (lumières, textures, objets) en trois dimensions et ce à partir de simple photos ou images en deux dimensions.

À lire : Comment l’IA de DeepMind est devenue imbattable aux échecs en seulement quatre heures

Le procédé appelé « Generative Query Engine » (GQE, moteur génératif de requêtes) est doublement impressionnant : pour cette capacité « humaine » de représentation de l’espace, d’une part, mais aussi pour sa capacité à apprendre seul.

GQE ne s’appuie en effet pas sur un corpus d’images de références (bases de données, etc.) et ne profite d’aucune supervision humaine. Une fois lâché dans la « nature » numérique, GQE utilise ses capteurs d’images (réels ou virtuels) pour capter une scène en 2D et son moteur « imagine » et construit automatiquement la scène en 3D. De quoi simplifier (éliminer ?) le travail des modeleurs 3D dans les jeux vidéo ou le cinéma !

Selon Ali Eslami, chercheur du projet DeepMind, cette nouvelle avancée technologique est « un pas de plus dans la création d’ordinateurs capables d’apprendre sans supervision humaine ». Un mot est intéressant dans la vidéo promotionnelle où DeepMind met en avant son succès : imagination. En essayant d’imiter la façon dont le cerveau humain se représente l’espace qui nous entoure, les chercheurs ont donné les outils à DeepMind pour « apprendre par l’observation », ce qui est moins long que de passer par des bases de données, mais ils lui ont ainsi donné le pouvoir d’imaginer ou prédire des éléments cachés ou absents des clichés de références tels que les lumières.
Un grand pas pour l’IA, une perte d’exclusivité de plus pour l’homme.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.