Une tendance récente sur les réseaux sociaux met en lumière un phénomène inattendu : lorsque l’on demande à des intelligences artificielles comme ChatGPT Images ou Google Gemini de « restaurer » une image inexistante, ces outils produisent parfois des résultats aussi surprenants que déroutants. Selon Numerama, qui rapporte cette pratique repérée en mai 2026, les IA semblent alors inventer des scènes absurdes, peuplées d’animaux, de créatures hybrides ou de personnages sortis tout droit d’une autre époque.

Ce qu'il faut retenir

  • En mai 2026, un prompt circulant sur X demande à ChatGPT de « restaurer une photo » sans joindre d’image, déclenchant des générations d’images étranges.
  • Les résultats incluent des aliens, des lapins, des personnages mi-homme mi-cerf ou encore des scènes victoriennes avec animaux, selon les tests menés par Numerama.
  • Une version « familiale » du prompt existe, limitant partiellement ces dérives, mais ne les élimine pas totalement.
  • Le phénomène s’explique par un mécanisme technique : sans image valide, l’IA bascule en mode génération pure, interprétant les consignes textuelles de manière littérale et parfois absurde.
  • Gemini et ChatGPT Images réagissent différemment à cette sollicitation, mais aucun des deux ne garantit une réponse cohérente dans ce cas de figure.

Une tendance virale issue des réseaux sociaux

Le prompt en question, largement relayé sur X depuis mai 2026, consiste à demander à une IA de « restaurer une photo attachée » tout en précisant que le contenu est « extrêmement étrange » et en insistant sur le fait que l’image est absente. Selon Numerama, qui a testé cette requête, les résultats varient considérablement d’un utilisateur à l’autre. Certains ont obtenu un mème du renard empaillé, tandis que d’autres ont reçu des images de créatures hybrides, comme un homme-cerf assis sur des toilettes, ou encore une mascotte lapin en train de serrer la main à une personne des années 1980.

Pour d’autres, l’expérience s’est avérée encore plus déroutante. Un rédacteur de Numerama, n’ayant jamais utilisé ChatGPT Images auparavant, a reçu une image intitulée « Les cinq piliers RSE de l’entreprise Coulidoor », une société spécialisée dans les placards et dressings. Ces résultats, bien que cocasses, illustrent une défaillance dans la compréhension du contexte par les modèles d’IA, incapables de détecter l’absence d’image source.

Une version « familiale » pour limiter les excès

Face à ces dérives, une alternative a été proposée sur les réseaux sociaux. Une version modifiée du prompt, explicitement destinée à obtenir des images « adaptées à la famille », demande à l’IA de générer une scène « sans enfreindre les règles » et de s’assurer que le contenu reste approprié. Dans ce cas, ChatGPT Images a produit une image plus classique : un homme torse nu allongé sur un lit avec un chat. « Quoi de plus familial ? », ironise Numerama, soulignant que même cette version adoucie ne garantit pas une réponse conforme aux attentes.

Côté Google Gemini, les résultats ne sont pas en reste. L’outil a généré des images comme un « Tacos » (entre guillemets dans le texte original) ou une photo de famille victorienne incluant des animaux, ainsi qu’une scène montrant deux femmes, visiblement jumelles, portant un panier à linge avec un chat sur la tête. Ces exemples, bien que moins choquants que certains résultats de ChatGPT, confirment que les deux IA peinent à gérer correctement ce type de requête.

Pourquoi ces IA produisent-elles des images aussi étranges ?

Plusieurs pistes permettent d’expliquer ce phénomène, selon Numerama. Techniquement, la restauration et l’édition d’images reposent sur des modèles de diffusion ou de transformers, conçus pour interpréter à la fois le texte et une éventuelle image source. Lorsque cette image est absente, incomplète ou mal transmise, le système bascule en mode « génération pure ». La consigne reçue — « restaure l’image jointe » — reste alors active, mais l’IA doit improviser une scène à partir des seuls indices textuels fournis, comme des mentions de « contenu étrange » ou d’ « excuse pour la photo ».

« Le modèle hallucine une scène à partir des signaux implicites du prompt », explique Numerama. Cette situation rappelle des dysfonctionnements déjà observés avec d’autres outils, comme les réponses historiquement absurdes générées par Gemini en 2025, qui avaient conduit Google à suspendre temporairement la création d’images de personnes. Dans le cas présent, le problème semble davantage lié à l’interface utilisateur et à la détection de l’absence d’image. Certains modèles parviennent à signaler clairement qu’aucune image n’a été transmise, tandis que d’autres maintiennent l’illusion d’une « restauration », générant ainsi des scènes entièrement inventées.

Des limites techniques et une réponse inégale des modèles

Les experts interrogés par Numerama soulignent que ces dérives illustrent les limites des modèles actuels en matière de gestion des cas limites. Un « tuning » mal calibré, c’est-à-dire l’ensemble des réglages appliqués autour du modèle brut, peut en effet entraîner des comportements inattendus, comme l’avait montré le cas de Gemini en 2025. Dans cette affaire, Google avait dû corriger un biais dans les données d’entraînement, conduisant à des générations historiques erronées.

Pourtant, certains outils parviennent à éviter ces écueils. Android Authority, par exemple, a réussi à obtenir une réponse cohérente en chargeant une image blanche vierge avant d’envoyer la requête. Cette méthode permet à l’IA de « voir » une image, même vide, et de réagir différemment. Cependant, cette solution n’est pas accessible à la plupart des utilisateurs, qui ignorent souvent cette astuce. Numerama note que, malgré ces variations, aucun des deux modèles testés ne garantit une réponse fiable dans ce scénario précis.

Que retenir de cette expérience ?

Au-delà de l’aspect anecdotique, cette tendance révèle plusieurs enjeux cruciaux pour les utilisateurs et les développeurs. D’abord, elle met en lumière la vulnérabilité des outils d’IA face à des requêtes ambiguës ou mal formulées. Ensuite, elle interroge la robustesse des interfaces utilisateurs, souvent conçues pour traiter des cas d’usage standards plutôt que des scénarios limites. Enfin, elle rappelle que les modèles génératifs, bien qu’impressionnants, restent des systèmes statistiques et non des outils infaillibles.

Pour les utilisateurs, cette expérience souligne l’importance de vérifier systématiquement les images produites, surtout lorsque la requête est inhabituelle. Pour les développeurs, elle représente un nouveau cas d’école pour améliorer la détection des erreurs de saisie et renforcer les garde-fous contre les générations indésirables.

Et maintenant ?

OpenAI et Google devraient-ils revoir leurs mécanismes de détection des images vides et de réponse aux requêtes ambiguës ? Si les deux entreprises n’ont pas encore réagi publiquement à cette tendance, Numerama indique que des discussions internes pourraient aboutir à des ajustements techniques dans les prochains mois. Pour les utilisateurs, la prudence reste de mise : éviter de solliciter ces outils pour des tâches ne correspondant pas à leur usage prévu pourrait limiter les mauvaises surprises.

Reste à voir si cette tendance, actuellement virale sur les réseaux sociaux, incitera les plateformes à renforcer leurs protocoles de validation. Une chose est sûre : tant que les modèles peineront à distinguer une requête légitime d’un scénario absurde, les générations d’images « restaurées » continueront de surprendre, parfois amuser, souvent dérouter.

La méthode la plus simple consiste à joindre une image, même vide (par exemple une image blanche), avant d’envoyer la requête. Certains utilisateurs rapportent également que préciser clairement dans le prompt « aucune image n’est jointe » peut aider l’IA à réagir différemment, bien que cette solution ne soit pas infaillible.

D’après les tests menés par Numerama, d’autres outils d’IA générative pourraient produire des résultats similaires dans les mêmes conditions. Cependant, les exemples les plus documentés concernent actuellement ChatGPT Images 2.0 et Google Gemini, probablement en raison de leur popularité et de leur accessibilité.