À l’occasion de la Google I/O 2026, Numerama a pu tester en avant-première Google Genie 3, le dernier modèle de génération de mondes virtuels interactifs développé par Google DeepMind. Cette technologie, désormais capable de créer des environnements 3D explorables à partir d’images issues de Google Street View, marque une avancée majeure dans le domaine de l’intelligence artificielle générative et du jeu vidéo.
Ce qu'il faut retenir
- Genie 3 génère des mondes virtuels 3D interactifs en temps réel à partir d’images fixes, avec une résolution de 720p à 24 images par seconde.
- La technologie permet de transformer n’importe quelle rue capturée par Street View en un environnement jouable, ouvrant des perspectives inédites pour les jeux vidéo et la simulation.
- Un abonnement à Google AI Ultra (200 dollars par mois) est nécessaire pour y accéder depuis janvier 2026.
- Les mondes générés s’adaptent automatiquement au personnage choisi, avec des mécaniques de gameplay adaptées (vol pour un astronaute, nage pour un poisson, etc.).
- Google utilise déjà des versions antérieures de Genie pour entraîner ses véhicules autonomes Waymo.
- La technologie reste limitée par une latence élevée, une qualité graphique perfectible et une consommation importante de ressources.
Une technologie née d’un rêve d’enfant devenu réalité
Lors de la conférence annuelle de Google à Mountain View, Numerama a pu expérimenter Genie 3 dans des conditions optimales. Le principe est simple : à partir de deux orbes, l’un représentant un personnage (un astronaute dans notre cas) et l’autre un lieu (un terrain de football), l’IA génère en moins d’une minute un monde ouvert explorable à la manette.
L’expérience rappelle les ambitions d’un enfant découvrant GTA Vice City dans les années 2000. « Pourquoi le jeu se déroulait-il à Miami et pas dans n’importe quelle ville du monde ? » s’interrogeait alors l’auteur de l’article de Numerama. Vingt ans plus tard, cette question trouve une réponse technologique, même si les 10 années de développement nécessaires à la création de GTA VI rappellent que la réalité reste encore éloignée des fantasmes les plus fous.
Des mondes générés en temps réel, mais encore imparfaits
Le modèle Genie 3 se distingue par sa capacité à produire des environnements en 3D interactive, contrairement aux versions précédentes limitées à des univers 2D ou à des vidéos statiques. Selon Numerama, les mondes générés sont explorables pendant plusieurs minutes, avec un rendu en 720p à 24 images par seconde. Cependant, la technologie présente encore des limites majeures : latence élevée, qualité graphique perfectible et absence de physique réaliste.
Lors de la démonstration, l’auteur a pu marquer des buts dans une partie inspirée de Rocket League, mais a rapidement constaté les limites du système. « La balle a disparu quand je me suis retourné », relève-t-il, illustrant les instabilités visuelles inhérentes à un processus de génération en temps réel.
Street View comme base de données infinie pour l’IA
Avec plus de 280 milliards d’images capturées depuis 2006, Google Street View constitue une base de données colossale pour Genie 3. Numerama souligne que cette technologie pourrait permettre de « ressusciter » des villes ou des quartiers disparus, comme un Nice virtuel version 2010 ou le quartier d’enfance d’un utilisateur. « Qui n’a jamais rêvé de retourner dans la ville de son enfance ? », interroge l’article.
Le potentiel est immense : générer des décors pour des jeux vidéo, peupler des intérieurs virtuels, ou même créer des outils comme un GeoGuessr amélioré où l’on se déplace vraiment dans les rues. Pour autant, cette fonctionnalité n’était pas accessible lors de la démonstration de Numerama, qui espère pouvoir la tester prochainement.
Un outil prometteur, mais pas encore mature pour remplacer l’industrie du jeu vidéo
Malgré son potentiel révolutionnaire, Genie 3 reste un outil expérimental, loin de pouvoir concurrencer les studios de développement. Numerama rappelle que la technologie nécessite des ressources colossales : un abonnement à 200 dollars par mois pour un usage personnel, et une consommation énergétique incompatible avec une utilisation grand public à grande échelle.
Google, qui utilise déjà Genie pour entraîner ses voitures autonomes Waymo, pourrait en revanche en faire un outil précieux pour les développeurs. « Générer des décors, peupler des intérieurs, prototyper rapidement des univers… Les usages sont nombreux », souligne Numerama. À terme, la technologie pourrait accélérer la création de jeux vidéo, en automatisant des tâches aujourd’hui réalisées manuellement.
« Imaginer un GTA dans lequel chaque immeuble est visitable, ou des PNJ [personnages non-joueurs] adossés à un modèle de langage comme Gemini peuvent réellement vous répondre… La perspective n’a rien d’absurde. »
— Numerama
Une technologie qui soulève des questions éthiques et pratiques
L’utilisation de données issues de Google Street View pour générer des mondes virtuels pose plusieurs questions. Numerama évoque notamment la protection de la vie privée, alors que des images de rues et de passants sont réutilisées pour créer des environnements de jeu. La question de la propriété intellectuelle se pose également : qui détient les droits sur un monde généré à partir d’images capturées dans l’espace public ?
Par ailleurs, l’accès payant à cette technologie (200 dollars par mois) limite son potentiel démocratisateur. « Difficile d’imaginer Google maintenir un service aussi gourmand au prix actuel », note Numerama. Le géant du web, malgré ses ressources, devra trouver un modèle économique viable pour démocratiser Genie 3.
La prochaine étape pour Google consistera probablement à améliorer la cohérence des environnements générés et à réduire les ressources nécessaires à leur création. Numerama évoque même un rêve d’enfant : « survoler la maison de mes grands-parents en incarnant un hibou ». Une perspective qui, si elle se concrétise, pourrait bien redéfinir notre rapport au jeu vidéo et à la simulation.
En attendant, l’industrie du jeu vidéo observe avec attention les progrès de Genie 3. Si la technologie ne remplacera pas les studios de développement dans un avenir proche, elle pourrait devenir un outil complémentaire essentiel, accélérant la création de mondes virtuels et ouvrant la voie à de nouvelles formes de narration interactive.