Google vient de durcir les conditions d’utilisation de ses modèles d’intelligence artificielle intégrés à Gemini, mettant fin à une époque où les abonnés pouvaient multiplier les requêtes sans compter. Selon Journal du Geek, le géant de Mountain View remplace désormais son système de comptage par la puissance de calcul consommée par chaque requête, une mesure qui pourrait redéfinir l’usage des outils d’IA payants.

Cette évolution intervient alors que les coûts énergétiques et computationnels des grands modèles de langage deviennent un enjeu majeur pour les géants technologiques. Jusqu’ici, les abonnés à Gemini Advanced bénéficiaient d’un accès « illimité » aux modèles, sous réserve de respecter les conditions générales d’utilisation. Désormais, Google évalue l’activité non plus en nombre de prompts envoyés, mais en fonction des ressources mobilisées pour traiter chaque demande. Autant dire que les requêtes complexes, gourmandes en calcul, seront désormais plus coûteuses en termes de quota.

Ce qu'il faut retenir

  • Google remplace le comptage par nombre de prompts par une évaluation basée sur la puissance de calcul consommée pour chaque requête.
  • Cette mesure s’applique même aux abonnés Gemini Advanced, mettant fin à l’accès « illimité » tel qu’il était précédemment compris.
  • Les requêtes les plus gourmandes en ressources seront désormais plus pénalisantes en termes de quota.

Une facturation plus précise, mais moins transparente

Jusqu’à présent, les utilisateurs pouvaient estimer leur consommation en comptant simplement le nombre de messages envoyés à l’IA. Avec cette nouvelle méthode, Google introduit une logique plus proche de celle des data centers : chaque opération, selon sa complexité, consomme plus ou moins de « crédits » invisibles pour l’utilisateur. Journal du Geek souligne que cette approche reflète une volonté de mieux répartir les coûts internes, mais risque de compliquer la compréhension pour les abonnés.

D’après les explications de Google relayées par Journal du Geek, cette transition s’inscrit dans une stratégie plus large de responsabilisation des utilisateurs, alors que l’IA générative devient un service quotidien pour des millions de personnes. « Nous ajustons nos modèles pour refléter l’impact réel de chaque requête », a précisé un porte-parole de l’entreprise, sans toutefois détailler les seuils exacts de consommation.

Un changement qui interroge les abonnés et les entreprises

Cette annonce pourrait avoir des répercussions significatives pour les entreprises et les développeurs qui intègrent Gemini dans leurs outils. Ceux-ci devront désormais anticiper leurs dépenses en fonction de la complexité des tâches automatisées, un paramètre autrefois secondaire. Journal du Geek évoque notamment le cas des startups spécialisées dans l’IA, dont certaines dépendent de requêtes massives pour entraîner ou affiner leurs propres modèles.

Les utilisateurs individuels ne sont pas en reste. Ceux qui sollicitent régulièrement l’IA pour des tâches comme la rédaction de longs documents ou l’analyse de fichiers volumineux pourraient voir leur quota s’épuiser plus rapidement. Google n’a pas communiqué de barème public, mais selon des retours d’utilisateurs cités par Journal du Geek, les premières observations indiquent une consommation accrue pour les requêtes impliquant des pièces jointes ou des traitements multi-étapes.

Vers une généralisation de cette logique ?

Cette initiative de Google s’inscrit dans un contexte où les géants du numérique cherchent à optimiser leurs infrastructures face à la demande croissante en IA. Les data centers consomment désormais autant d’électricité que certains pays entiers, et les coûts associés poussent les entreprises à revoir leur modèle économique. Journal du Geek rappelle que Microsoft et Amazon ont récemment introduit des systèmes similaires pour leurs services d’IA cloud, comme Azure AI ou Bedrock.

Reste à voir si cette approche sera adoptée par d’autres acteurs du secteur. Pour l’heure, Google n’a pas précisé si cette mesure s’étendrait à d’autres produits, comme Bard ou les outils intégrés à Workspace. Une chose est sûre : l’ère de l’IA « gratuite » ou « illimitée » telle qu’on l’a connue jusqu’ici est bel et bien terminée.

Et maintenant ?

Cette modification devrait prendre effet progressivement d’ici les prochains mois, selon les premières estimations de Journal du Geek. Google pourrait détailler les nouveaux seuils de consommation lors de sa prochaine conférence dédiée aux développeurs, prévue en juillet 2026. Les abonnés concernés auraient alors quelques semaines pour ajuster leurs habitudes, sous peine de voir leurs accès temporairement suspendus en cas de dépassement. Une période de transition est également envisagée pour permettre aux utilisateurs de s’adapter à cette nouvelle logique.

Cette évolution marque un tournant dans la démocratisation de l’IA : si l’accès aux outils devient plus contraint, il pourrait aussi devenir plus durable. Reste à savoir si les utilisateurs, particuliers comme professionnels, seront prêts à payer le prix réel de cette technologie.