Anthropic face à la crise des tokens : quand l’imprévisible gestion des crédits de Claude irrite les utilisateurs

Q: Qu’est-ce qu’un token et pourquoi son utilisation est-elle si critique ?

Un token est une unité de base utilisée par les modèles d’intelligence artificielle pour traiter les requêtes. Chaque interaction avec un modèle comme Claude consomme un certain nombre de tokens, dont le coût dépend de la complexité de la requête. Pour les développeurs, la gestion de ces tokens est cruciale, car elle détermine le coût et la faisabilité de leurs projets. Une consommation imprévisible rend la planification budgétaire et technique extrêmement difficile.

L’entreprise américaine Anthropic, qui s’est imposée ces derniers mois comme l’un des acteurs majeurs de l’intelligence artificielle, se retrouve aujourd’hui confrontée à une difficulté majeure : la gestion des quotas de tokens pour ses abonnés, selon Numerama. Une situation qui rend la consommation de ses services imprévisible et frustrante pour une partie de ses utilisateurs, notamment les développeurs travaillant sur des projets complexes.

Ce qu'il faut retenir

Anthropic peine à anticiper la consommation réelle des tokens par ses utilisateurs, rendant les abonnements Pro, Max 5x et Max 20x difficiles à appréhender.
Les limites de session de cinq heures sont désormais ajustées pendant les heures de pointe, accélérant l’épuisement des crédits pour les abonnés gratuits, Pro et Max.
La documentation officielle ne fournit que des ordres de grandeur (ex. : « au moins cinq fois plus que le gratuit » pour le Pro), sans donner de points de repère absolus.
Les utilisateurs dénoncent un manque de transparence et une consommation accélérée des limites, notamment pour les projets exigeants.
Cette situation reflète une tension structurelle dans le secteur, partagée par d’autres acteurs comme Google.
Anthropic admet que « bon nombre d’abonnés atteignent leurs limites bien plus rapidement que prévu ».

Une gestion des quotas devenue ingérable pour les utilisateurs

Anthropic propose quatre formules d’abonnement pour son modèle d’IA Claude : un forfait gratuit, un forfait Pro, un forfait Max 5x et un forfait Max 20x. Chacun de ces forfaits s’accompagne de capacités de consommation différentes, mais la réalité montre que ces limites sont difficiles, voire impossibles, à prévoir. « Il est très difficile d’anticiper la consommation effective de ces tokens, tant elle peut varier selon les requêtes, leur longueur, leur complexité ou le modèle sollicité », explique Numerama.

Cette imprévisibilité s’est traduite par une série d’ajustements techniques récents, dont les effets n’ont fait qu’exacerber les frustrations des utilisateurs. Les limites horaires et les ajustements de session, introduits pour gérer la demande croissante, ont en effet complexifié la compréhension des capacités réelles offertes par chaque forfait. Résultat : les développeurs, en particulier, se retrouvent dans une situation où la planification de leurs projets devient un casse-tête.

Des ajustements techniques qui ne convainquent pas

Le 26 mars 2026, Thariq Shihipar, ingénieur chez Anthropic, a annoncé sur X (ex-Twitter) un changement majeur : pendant les heures de pointe, situées entre 5h et 11h en Californie (soit de 14h à 20h en France), les utilisateurs de Claude verront leurs limites de session de cinq heures épuisées plus rapidement qu’avant. « Afin de gérer la demande croissante pour Claude, nous ajustons la limite de session à cinq heures pour les abonnés gratuits, Pro et Max aux heures de pointe. Vos limites hebdomadaires restent inchangées », a-t-il précisé. Selon ses calculs, « 7 % des utilisateurs atteindront des limites qu’ils n’auraient pas atteintes auparavant ».

Pourtant, cette mesure n’a pas rassuré les utilisateurs. Beaucoup soulignent que ces ajustements rendent encore plus difficile l’estimation de leur consommation avant d’atteindre la limite. Un paradoxe pour une entreprise qui se targue de proposer des outils performants pour les développeurs. Sur les réseaux sociaux, les plaintes se multiplient, et les réponses des équipes techniques d’Anthropic peinent à convaincre.

Une documentation floue et des comparaisons impossibles

Le cœur du problème réside dans l’absence de transparence d’Anthropic concernant ses forfaits. La documentation officielle indique par exemple qu’un forfait Pro offre « au moins cinq fois plus d’utilisation par session que le service gratuit ». Le forfait Max 5x promet quant à lui cinq fois plus que le Pro, et le Max 20x, vingt fois plus. Pour les utilisateurs, ces descriptions sont trop vagues pour leur permettre de comparer efficacement les offres. « Un forfait Team Standard offre 1,25 fois plus que le forfait Pro », précise encore la documentation, sans jamais donner de points de repère absolus.

Cette opacité est d’autant plus mal perçue que seuls les utilisateurs passant par l’API bénéficient d’une vision claire de leur consommation, mesurée directement en tokens. Pour les autres, la jauge de leur tableau de bord affiche le quota consommé sans jamais indiquer le plafond exact. Une situation qui pousse certains développeurs à atteindre les limites d’utilisation « bien trop rapidement », comme en témoignent de nombreux retours sur Reddit.

Anthropic reconnaît les limites de son modèle, mais les solutions tardent

Face à cette grogne, Anthropic a tenté de rassurer. L’entreprise a confirmé que « bon nombre de ses abonnés atteignent leurs limites d’utilisation bien plus rapidement que prévu » et a assuré travailler à des améliorations. Pourtant, les solutions proposées jusqu’à présent relèvent davantage du « bricolage » que d’une refonte structurelle. « Comment proposer un modèle transparent et prévisible pour une technologie qui, par essence, s’adapte à la demande de l’utilisateur ? », s’interroge Numerama. Pour l’heure, la réponse reste floue.

Cette situation illustre une tension plus large au sein du secteur de l’IA. En janvier 2026, Sam Altman, PDG d’OpenAI, avait lui-même admis que les abonnements Pro de son entreprise ne couvraient pas toujours les coûts engendrés par la génération. Un problème que semble désormais partager Anthropic, dont la croissance rapide met à rude épreuve son infrastructure technique et son modèle économique.

Et maintenant ?

Les prochaines semaines seront déterminantes pour Anthropic. L’entreprise devra soit clarifier ses offres et ses limites, soit adapter ses tarifs pour refléter plus fidèlement ses coûts réels. Une chose est sûre : la pression ne faiblira pas, tant que les utilisateurs ne pourront pas anticiper leur consommation avec précision. Pour les développeurs, en particulier, la question des tokens reste un enjeu central — et une source de frustration croissante.

Un écosystème sous tension : le cas Google

Anthropic n’est pas la seule entreprise à rencontrer des difficultés avec ses modèles d’abonnement IA. Mi-mars 2026, Google a également fait face à une fronde similaire avec son assistant à la programmation Antigravity. Les modifications apportées à ses options d’abonnement ont suscité des critiques comparables à celles adressées à Anthropic. « C’est toute une industrie qui se retrouve face à ce défi », note Numerama. La question de la transparence et de la prévisibilité des coûts semble donc devenir un enjeu majeur pour les acteurs du secteur.

L’impossible équilibre entre innovation et rentabilité

Derrière cette crise des tokens se cache une problématique plus profonde : comment concilier innovation, accessibilité et rentabilité dans un marché aussi concurrentiel que celui de l’IA ? Anthropic a su se distinguer par la qualité de ses modèles, mais son succès même a révélé les failles de son modèle économique. Entre la nécessité de limiter l’accès pour éviter une saturation de l’infrastructure et le besoin de proposer des forfaits attractifs, l’entreprise marche sur un fil. Les prochains mois diront si elle parvient à trouver un équilibre — ou si elle devra revoir en profondeur sa stratégie.

En attendant, les utilisateurs, eux, n’ont d’autre choix que de s’adapter à une réalité où les tokens restent une monnaie d’échange aussi précieuse qu’imprévisible.

Un token est une unité de base utilisée par les modèles d’intelligence artificielle pour traiter les requêtes. Chaque interaction avec un modèle comme Claude consomme un certain nombre de tokens, dont le coût dépend de la complexité de la requête. Pour les développeurs, la gestion de ces tokens est cruciale, car elle détermine le coût et la faisabilité de leurs projets. Une consommation imprévisible rend la planification budgétaire et technique extrêmement difficile.

Anthropic justifie ces ajustements par la nécessité de gérer une demande croissante pour ses services. En période de forte affluence, les limites de session plus strictes permettent de répartir équitablement les ressources et d’éviter une saturation totale du système. Cependant, cette mesure a pour effet d’accélérer l’épuisement des crédits pour les utilisateurs, ce qui explique les nombreuses critiques.