Lors de la conférence I/O 2026, Google a annoncé une baisse de prix de son forfait AI Ultra, mais a parallèlement durci les quotas d’utilisation de son modèle Gemini Pro. Selon Numerama, un seul prompt complexe peut désormais consommer jusqu’à 13 % du quota hebdomadaire d’un abonné à l’offre AI Pro. Certains utilisateurs rapportent même que certaines fonctionnalités, comme la génération vidéo, peuvent atteindre 30 % de l’allocation en une seule requête.

Ce qu'il faut retenir

  • Un prompt complexe peut consommer jusqu’à 13 % du quota hebdomadaire d’un abonné à l’offre AI Pro de Google, et jusqu’à 30 % pour certaines fonctionnalités avancées.
  • Google a abandonné le décompte par nombre de prompts pour basculer vers un système basé sur la puissance de calcul consommée, incluant la complexité du prompt, les fonctionnalités sollicitées et la longueur de la conversation.
  • Les quotas se rechargent toutes les cinq heures pour la demande quotidienne, avec un plafond hebdomadaire supplémentaire.
  • Les utilisateurs professionnels, notamment ceux manipulant des fichiers longs, du code ou des vidéos, constatent une baisse significative de la valeur de leur abonnement.
  • Varun Mohan, responsable de l’équipe Antigravity chez Google, a annoncé un triplement permanent des limites pour cette offre spécifique, tandis que les quotas de l’application grand public Gemini restent inchangés.

Un changement de modèle : du nombre de prompts à la puissance de calcul

D’après les informations rapportées par Numerama, Google a opéré un virage stratégique en abandonnant le décompte traditionnel par nombre de prompts au profit d’un système basé sur le compute, c’est-à-dire la puissance de calcul réellement consommée par chaque requête. Trois critères déterminent désormais l’usure des quotas : la complexité du prompt soumis, les fonctionnalités activées — comme la génération vidéo, la recherche approfondie ou le raisonnement étendu — et la longueur de la conversation en cours. Les abonnés disposent d’un rafraîchissement des quotas toutes les cinq heures pour la partie quotidienne, complété par un plafond hebdomadaire.

Si cette approche se défend techniquement — une requête vidéo mobilisant effectivement plus de ressources qu’une simple demande de résumé ou de traduction —, elle se heurte à une réalité pratique plus contraignante. Plusieurs témoignages recueillis par 9to5Google et relayés sur Reddit et X indiquent que les limites sont atteintes bien plus rapidement qu’auparavant. Certains utilisateurs rapportent avoir épuisé près de la moitié de leur allocation en seulement cinq prompts, parfois moins.

Des quotas opaques et des comparaisons difficiles

Le principal écueil réside dans l’absence de barème public détaillé par Google. Les abonnés doivent se contenter d’un tableau de bord d’utilisation, intégré à l’application, pour estimer leur consommation. La communication officielle met en avant le fait que l’offre AI Pro offre désormais « quatre fois la limite du tier gratuit », mais cette comparaison reste peu pertinente, selon les observateurs. L’ancienne version de l’abonnement Pro, qui plafonnait au nombre de messages, n’est plus mentionnée, rendant toute comparaison directe impossible.

Pourtant, cette évolution s’inscrit dans une tendance plus large observée chez les concurrents. Anthropic, avec son modèle Claude, facture déjà son usage sur des fenêtres de cinq heures. OpenAI, de son côté, a multiplié les paliers tarifaires depuis le lancement de GPT-5.2. Malgré les optimisations techniques récentes, comme l’algorithme TurboQuant qui réduit par six l’empreinte mémoire des modèles, le coût d’inférence d’un modèle de la classe de Gemini 3.1 Pro reste particulièrement élevé.

Des ajustements limités face aux critiques des utilisateurs

Face aux nombreuses plaintes exprimées sur Reddit et les forums dédiés aux développeurs, Varun Mohan, responsable de l’équipe Antigravity chez Google, a annoncé sur X un ajustement des quotas pour cette offre spécifique. Les limites ont été triplées de manière permanente, et les quotas hebdomadaires ont été réinitialisés pour certains utilisateurs. Ces mesures ciblent principalement les professionnels utilisant des fonctionnalités avancées, mais l’application grand public Gemini conserve son nouveau plafond, jugé plus restrictif.

Pour les abonnés payant 19,99 dollars par mois, l’impact varie selon l’usage. Les demandes basiques, comme les échanges textuels courts, ne sont pas affectées. En revanche, ceux qui exploitent Gemini pour du développement logiciel, l’analyse de fichiers volumineux ou la création de contenus vidéo — des cas d’usage mis en avant par Google lors de ses keynotes destinées aux professionnels — voient la valeur de leur abonnement se réduire significativement. Le modèle économique, désormais basé sur le compute, transforme ce qui était inclus dans l’abonnement en services complémentaires payants.

Et maintenant ?

Google pourrait être contraint d’ajuster davantage ses quotas, surtout si les retours des utilisateurs professionnels continuent de souligner des limites trop restrictives pour des usages intensifs. La prochaine mise à jour de Gemini 3.1 Pro ou l’introduction d’un nouveau modèle pourrait également influencer la consommation des ressources. Les abonnés concernés devraient surveiller les annonces officielles, notamment celles prévues lors des prochaines conférences techniques, pour adapter leur stratégie d’utilisation.

Une évolution inévitable, mais à quel prix ?

Le passage à un système de facturation basé sur le compute reflète une tendance de fond dans l’industrie de l’IA. Les éditeurs cherchent à aligner les coûts d’utilisation sur les dépenses réelles d’infrastructure, tout en évitant des modèles d’abonnement trop élevés au lancement. Si cette approche technique peut se justifier à long terme, elle soulève des questions sur l’accessibilité des outils d’IA pour les petits acteurs ou les indépendants. Gemini Pro illustre ainsi le dilemme actuel : comment concilier innovation, rentabilité et équité dans un secteur où les coûts de calcul restent prohibitifs ?

Une chose est sûre : les utilisateurs devront désormais composer avec une gestion plus stricte de leurs quotas, au risque de voir leurs projets professionnels ou créatifs ralentis par des limites techniques. Reste à savoir si Google parviendra à trouver un équilibre satisfaisant entre tarification, performance et simplicité d’usage.

Google a intégré un tableau de bord « Usage limit » directement dans l’application Gemini. Les abonnés peuvent y consulter leur consommation en temps réel, avec une ventilation par période quotidienne et hebdomadaire. Pour y accéder, il suffit de se rendre dans les paramètres de l’application.

Oui, Google propose désormais une option payante pour acheter des quotas supplémentaires. Cette possibilité, annoncée lors de l’I/O 2026, permet de compléter son allocation en fonction de ses besoins, transformant ainsi ce qui était autrefois inclus dans l’abonnement en un service additionnel.