En août 2025, un développeur qui traduisait des descriptions de produits textuels a reçu une facture de plus de 1 000 $. Un autre a découvert 70 000 $ de charges pour des images qu’il n’avait jamais générées. C’était un bug, oui. Mais le vrai problème, c’est que l’API Gemini était, jusqu’au 16 mars 2026, la seule grande API d’IA sans plafond de dépenses configurable. Quand le bug est arrivé, il n’y avait rien pour l’arrêter. Google vient de corriger ça, avec plusieurs années de retard sur OpenAI et Anthropic.
Un bug à 70 000 $ qui a tout déclenché
En août 2025, une erreur de configuration dans le système de facturation Gemini a mal catégorisé des tokens « thinking » internes comme des tokens de génération d’images natives. Des frais de génération d’image ont été facturés à des développeurs qui ne travaillaient qu’avec du texte. Certains ont découvert des charges quotidiennes entre 300 $ et 500 $ malgré leurs comptes désactivés. L’un d’eux a vu sa facture augmenter de 200 $ en 20 minutes.
Google a reconnu « une configuration tarifaire incorrecte » pour le service « 2.5 Flash Native Image Generation » et a émis des crédits plutôt que des remboursements directs sur carte. Plusieurs développeurs ont dû ouvrir des litiges bancaires, ce qui a déclenché des blocages de comptes exigeant une pièce d’identité gouvernementale. Pendant ce temps, le dashboard de facturation Gemini affichait des délais allant jusqu’à 48 heures, rendant toute détection en temps réel impossible.
Ce que les nouveaux outils apportent concrètement
Google a annoncé le 16 mars 2026, dans un billet signé Jason Stephen, trois fonctionnalités accessibles depuis Google AI Studio.
Les Project Spend Caps permettent de définir un plafond mensuel de dépenses par projet, depuis l’onglet « Spend » de l’interface. Ce plafond reste actif jusqu’à modification manuelle. Limite notable : le système applique les caps avec un délai d’environ 10 minutes. Les dépassements constatés pendant cette fenêtre restent à la charge de l’utilisateur. Le cas du bug d’août 2025, où 200 $ étaient générés en 20 minutes, illustre ce que ce délai peut encore laisser passer.
Les tiers d’usage ont été redessinés avec des seuils abaissés. Le Tier 1 plafonne à 250 $/mois. Le Tier 2, accessible après 100 $ cumulés et 3 jours depuis le premier paiement, monte à 2 000 $/mois. Le Tier 3, après 1 000 $ cumulés et 30 jours, permet entre 20 000 $ et 100 000 $/mois. Ces plafonds système ne seront appliqués qu’à partir du 1er avril 2026, date à laquelle Google activera l’enforcement automatique sur l’ensemble des comptes.
Les nouveaux dashboards incluent un graphique de coûts journaliers filtrable par projet et par modèle, un suivi des rate limits en requêtes et tokens par minute, des métriques d’erreurs et la configuration du profil de facturation directement dans AI Studio, sans passer par Google Cloud Console.
OpenAI et Anthropic proposaient ça depuis des années
La critique qui revient le plus souvent dans les forums développeurs : « Tous les autres fournisseurs d’API que je connais permettent d’établir une limite stricte. Seul Google continue de vous facturer sans limite. » Ce n’est pas une exagération. OpenAI offrait des plafonds de dépenses par projet depuis plusieurs années. Anthropic appliquait des caps au niveau du workspace et par tier. L’API Gemini était la seule des trois grandes plateformes à ne pas proposer cette protection de base.
Ce décalage a eu des conséquences concrètes sur l’adoption en production. Intégrer une API sans plafond configurable dans une application grand public, c’est accepter qu’un pic de trafic, une boucle infinie dans un agent ou un bug côté Google puisse vider un compte avant la fin du mois sans aucun filet. Beaucoup d’équipes ont préféré rester sur OpenAI ou Anthropic pour cette raison précise, indépendamment des performances ou des prix au token.
Ce que ces outils ne règlent pas encore
Le délai de 10 minutes sur les Project Spend Caps reste une vraie limite. Dans le scénario du bug d’août 2025, il aurait réduit les dégâts, pas les supprimé. Les completions en mode batch peuvent par ailleurs générer des dépassements au-delà des caps projet. Et les caps système des tiers ne seront actifs qu’au 1er avril, ce qui laisse encore deux semaines sans enforcement automatique pour les nouveaux comptes.
Il reste aussi une question plus large sur la transparence du système de catégorisation des tokens. Le bug d’août 2025 venait d’un problème interne de labellisation que les développeurs ne pouvaient pas détecter ni anticiper. Les nouveaux dashboards donnent de la visibilité sur les dépenses, pas sur la façon dont Gemini classe les tokens en interne. C’est un angle mort différent du premier, mais il existe.
Ce que ça change pour les équipes en production
Pour les développeurs qui hésitaient à déployer Gemini en production, les Project Spend Caps répondent à l’objection la plus fréquente. Sur les forums Google AI Developers et Hacker News, l’absence de plafond configurable revenait systématiquement dans les comparaisons avec OpenAI ou Anthropic comme raison de ne pas choisir Gemini pour des applis grand public.
Les outils annoncés le 16 mars sont un rattrapage nécessaire, pas une avance. Ce qui manque encore : une politique de remboursement directe (pas uniquement des crédits), des délais de dashboard sous 10 minutes en conditions normales et plus de transparence sur la façon dont les tokens sont catégorisés en interne. Le bug d’août 2025 a entamé la confiance. Ça, un onglet « Spend » ne le répare pas.