Accueil » Actualité » Cette IA transforme n’importe quelle image en 3D avec une précision déconcertante 

Cette IA transforme n’importe quelle image en 3D avec une précision déconcertante 

Des chercheurs de Stanford ont développé un modèle d’intelligence artificielle (IA), EG3D, qui peut générer des images 2D en 3D aléatoires de visages et d’autres objets à haute résolution, avec des structures géométriques sous-jacentes. Le résultat est saisissant.

Les résultats d'EG3D © Stanford Computational Imaging Lab
Les résultats d’EG3D © Stanford Computational Imaging Lab

Les intelligences artificielles sont de plus en plus performantes. Si certaines sont déjà capables de créer des images en 2D particulièrement réalistes ou de créer des images à partir d’un texte, la 3D est une autre paire de manche, l’énorme puissance de calcul nécessaire étant un obstacle.

Le modèle d’intelligence artificielle EG3D, créé par une équipe d’universitaires de Stanford, peut être utilisé pour produire des images aléatoires particulièrement précises d’objets et de visages. Cette IA est l’une des premières à proposer une qualité de rendu proche du photoréalisme.

Des images en 2D transformées en 3D

L’EG3D utilise une méthode d’apprentissage automatique particulièrement populaire connue sous le nom de réseau antagoniste génératif (GAN). En utilisant un réseau neuronal pour créer des images et un autre pour évaluer leur précision, ces systèmes opposent deux réseaux neuronaux l’un à l’autre.

Le GAN s’est déjà avéré efficace pour la recréation d’images en 2D. Mais comme l’a partagé MarketTechPost, les chercheurs de Stanford ont réussi à l’utiliser pour créer ces incroyables rendus en 3D (voir la vidéo ci-dessous), une prouesse.

À lire : LaMDA : l’IA de Google a une âme, assure un ingénieur suspendu

L’EG3D arrive ainsi à récupérer des images GAN en 2D et à les déplacer dans la troisième dimension. Comme l’indique les chercheurs, l’IA arrive à le faire sans trop nécessiter de ressources : elle se vante même d’y arriver depuis des ordinateurs portables. La page Github dédiée du projet recommande toutefois un à huit GPU Nvidia « haut de gamme ».

Les résultats sont saisissants. L’équipe a réussi à produire des images terriblement réalistes de visages de personnes, sous plusieurs angles. Bien qu’elle en soit encore à ses débuts, cette étude ouvre de nouvelles perspectives pour la création d’images et de modèles en 3D. Il ne reste plus qu’à voir comment elle sera utilisée à l’avenir.