Uber a englouti tout son budget IA pour 2026 dès avril. Microsoft a supprimé les licences de ses développeurs. L'IA devient un gouffre financier. Et les solutions arrivent, trop tard ?

LA FACTURE IA QUI FAIT MAL

En 2026, l'intelligence artificielle n'est plus un rêve de geek ou un outil de luxe. C'est devenu un monstre financier qui dévore les budgets des entreprises à une vitesse folle. Uber a déjà englouti l'intégralité de son budget IA pour 2026 dès le mois d'avril. Microsoft a dû retirer les licences Claude Code à ses développeurs seulement quelques mois après les leur avoir accordées. Un employé de Priceline a révélé à TechCrunch que le renouvellement d'un contrat avec Cursor était devenu 4 à 5 fois plus cher que prévu. Le problème ? Même si le prix par token a baissé, la consommation explose.

LA COURSE AUX TOKENS : UNE DROGUE QUI COÛTE CHER

Les entreprises qui se sont ruées sur les abonnements illimités en 2025 se réveillent aujourd'hui avec une gueule de bois financière. Elles tentent désespérément de comprendre où passe leur argent, de réduire leurs dépenses et de sauver ce qui peut l'être de leurs budgets. Pendant ce temps, un nouveau marché émerge pour leur venir en aide : des startups, des géants de la tech et un nouvel organisme de normalisation se lancent dans une course effrénée pour fournir aux entreprises les Outils et le langage nécessaires pour suivre leurs dépenses.

« Il y a six mois, mes conversations avec les clients portaient sur "Qu'est-ce que ça peut faire ? Est-ce assez performant ?". Aujourd'hui, ce n'est plus du tout le cas. Maintenant, c'est : "Écoutez, on dépense tellement. Quelle visibilité avez-vous ? Quelle capacité d'audit ? Quels contrôles sur les tokens ? Quelle est l'efficacité de vos modèles ?" »

Ces propos sont ceux d'Alexander Embiricos, responsable de l'entreprise chez OpenAI, lors d'un événement à New York cette semaine. Le constat est clair : l'industrie a basculé d'une logique de « toujours plus vite » à une obsession pour le contrôle des coûts.

UNE NOUVELLE DISCIPLINE : LA TOKENOMICS

C'est dans ce contexte que la Linux Foundation a dévoilé cette semaine les plans de la Tokenomics Foundation, un nouvel organisme de normalisation. Son objectif ? Instaurer la même discipline autour des tokens que le FinOps l'a fait pour les dépenses cloud.

« En avril et mai, j'ai commencé à entendre des entreprises : "Mon Dieu, on a dépassé notre budget tokens 2026 de 3 fois, et c'est seulement avril ." Nous avons commencé à entendre des crises existentielles. Toute la conversation est passée de "maximiser les tokens" et "aller vite" à "il nous faut des garde-fous, comment contrôler ça ?" »

Ces mots sont ceux de J.R. Storment, directeur exécutif de la FinOps Foundation, un projet sous l'égide de la Linux Foundation. Les demandes des PDG, poussant leurs équipes à utiliser les meilleurs modèles et à aller vite, coûte que coûte, ont créé une situation ingérable. Les nouveaux modèles sortis en novembre, comme Claude Opus 4.5 d'Anthropic, GPT-5.1 d'OpenAI et Gemini 3 Pro de Google, ont amélioré de manière significative les outils agentiques. Résultat ? Une consommation multipliée. Une entreprise aurait ainsi reçu une facture de 500 millions de dollars pour Claude après avoir oublié de limiter l'usage pour ses employés.

LA TOKENOMICS : UNE DROGUE DURE À DÉSINTOSIQUER

Chris Reed, directeur senior des finances IT chez Priceline, compare cette situation à une épidémie de drogue : « Ils vous laissent essayer pour vous rendre accro, et maintenant vous êtes prisonnier. » Son entreprise a commencé à mettre en place des limites de tokens pour certains groupes d'employés. Vitaly Gordon, PDG de la plateforme d'ingénierie Faros AI, raconte avoir discuté récemment avec un DSI qui lui a confié : « Un de mes ingénieurs a dépensé 40 000 dollars en tokens le mois dernier. Je ne sais même pas si je dois l'arrêter ou lui dire de continuer et d'inspirer les autres. »

PRODUCTIVITÉ VS. COÛTS : LE GRAND DÉBAT

Une enquête menée par Faros en mars auprès de 20 000 développeurs a révélé une réalité troublante : la production augmente, mais les bugs et les réécritures aussi. Jellyfish, une plateforme de gestion de l'ingénierie, a fait un constat similaire : les ingénieurs qui utilisent le plus de tokens sont environ deux fois plus productifs que ceux qui en utilisent moins. Mais ils consomment 10 fois plus de tokens pour y parvenir. Arcolano résume : « Le retour sur investissement dépend de la valeur commerciale finale du code livré (par exemple, le chiffre d'affaires), que la plupart des entreprises ne parviennent toujours pas à mesurer. »

« Suivre les coûts cloud, c'est un problème de données de plusieurs centaines de millions de lignes par mois. Suivre les coûts des tokens, c'est un problème de données de plusieurs billions de lignes par mois. Vous ne pouvez pas simplement coller ça dans une feuille de calcul ou même un outil basique. Il faut repenser fondamentalement vos outils, vos spécifications et vos systèmes comptables. »

C'est ce qu'explique J.R. Storment. Chez Priceline, Reed observe déjà des écarts inquiétants. Il note des divergences entre les données d'utilisation rapportées par un fournisseur et celles enregistrées en interne par Priceline : « J'ai commencé ma carrière dans la gestion des dépenses télécoms, et je vois les mêmes parallèles : des télécoms au cloud, puis à l'IA. Chaque fois que vous introduisez quelque chose de nouveau, c'est une aubaine pour les erreurs de facturation, les audits et les opportunités d'optimisation. »

LE MARCHÉ QUI SE CONSTITUE AUTOUR DE LA TOKENOMICS

Un marché commence à se former autour de ce problème. Il y a d'abord les entreprises spécialisées, comme Pay-i, qui suit, mesure et optimise les coûts et la performance des investissements en IA générative. Paid, quant à elle, permet aux développeurs de suivre les coûts, mesurer l'utilisation et facturer les utilisateurs en fonction de la valeur réelle plutôt que des abonnements. Puis il y a des sociétés comme Jellyfish, Waydev et Faros AI, qui proposent toutes un suivi des agents IA pour prouver le retour sur investissement des outils pour développeurs. Storment indique que la plupart des 180 fournisseurs au sein de la FinOps Foundation se tournent vers ce créneau.

Les entreprises disposant d'une distribution existante ajoutent également de nouvelles fonctionnalités pour profiter de ce nouveau marché. Ramp s'est récemment lancé dans la gestion des dépenses IA. Datadog et New Relic ont ajouté des services comme la gestion des coûts cloud, l'observabilité au niveau des tokens et le suivi des GPU. Lors de la conférence FinOps X la semaine prochaine, AWS devrait présenter de nouvelles fonctionnalités de gestion financière adaptées aux dépenses IA des entreprises.

L'EFFICACITÉ DES TOKENS : LE PROCHAIN ENJEU

Tiffany Luck, associée chez NEA, pense que l'efficacité des tokens et l'observabilité seront probablement intégrées au niveau de la couche « harnais » ou « application ». Elle cite l'exemple de Factory, une startup qui crée des agents IA pour les entreprises. Cette semaine, elle a lancé un routeur de modèles qui sélectionne automatiquement le bon modèle pour chaque tâche.

Vitaly Gordon s'attend à ce que les laboratoires de pointe et les autres fournisseurs de modèles adoptent une optimisation à la manière d'OpenRouter pour orienter les requêtes vers les modèles les moins chers. Une tendance qui commence déjà à se voir dans les factures Claude des entreprises : « Le rapport financier montre que même si vous appelez le modèle Opus, une partie des dépenses ira vers Sonnet ou Haiku, car ils sont assez intelligents pour le faire. Je pense que cela va devenir de plus en plus courant. »

L'ABSENCE DE LANGAGE COMMUN : LE DÉFI MAJEUR

Tous ces outils sont construits sans langage commun ni définitions partagées pour savoir combien coûte un token, ce qu'il produit et comment comparer les dépenses entre fournisseurs. C'est là que la Tokenomics Foundation espère se rendre utile. Cet organisme construit une définition canonique et un cadre pour la « tokenomics » : des normes ouvertes, des spécifications et des métriques pour l'utilisation et la facturation des tokens IA. Il prévoit également de nouvelles métriques pour l'économie de l'IA, comme le coût par intelligence ou les tokens par watt. Il compte aussi définir des métriques pour l'efficacité de la production de tokens et la consommation. Le groupe prévoit un lancement officiel en juillet et s'apprête à annoncer de nouveaux membres lors de la conférence FinOps X la semaine prochaine.

« L'économie des tokens est fondamentalement plus abstraite et opaque que tout ce que nous avons géré à cette échelle auparavant. Cela nécessite une approche opérationnelle différente de celle que l'industrie a construite pour le cloud. »

Ces mots sont ceux de Nishant Gupta, responsable de la disponibilité chez Salesforce. Pourtant, malgré ces défis, Goldman Sachs projette que l'utilisation mondiale des tokens sera multipliée par 24 d'ici 2030. Les entreprises déjà en dépassement de budget ont besoin de solutions maintenant, et le premier livrable de la fondation n'arrivera que dans quelques mois.

LA SOLUTION : UNE ADOPTION MODÉRÉE ET GÉNÉRALISÉE

Vitaly Gordon résume la situation avec une métaphore : « Peut-être avons-nous créé une machine à vapeur, mais nous n'avons pas encore inventé la chaîne de montage. » Arcolano va plus loin : « La meilleure approche pour un retour sur investissement consiste à faire passer la majorité des utilisateurs d'une utilisation faible à modérée, plutôt que de pousser les gros utilisateurs à consommer encore plus. »

CE QUE L'INDUSTRIE RÉFLÉCHIT À FAIRE

Les entreprises commencent à réagir. Certaines mettent en place des limites strictes sur l'utilisation des tokens. D'autres explorent des outils de suivi et d'optimisation. La Tokenomics Foundation tente d'unifier le langage et les métriques. Les fournisseurs de cloud ajoutent des fonctionnalités de gestion financière dédiées à l'IA. Mais le vrai défi reste de taille : comment concilier l'innovation technologique avec une gestion financière saine ?

L'URGENCE D'AGIR

Le temps presse. Les entreprises qui ont sous-estimé l'impact financier de l'IA se retrouvent aujourd'hui avec des factures astronomiques et des budgets en lambeaux. Les solutions existent, mais elles arrivent trop lentement pour beaucoup. La question n'est plus de savoir si l'IA va révolutionner l'industrie, mais comment les entreprises vont survivre à la révolution qu'elles ont elles-mêmes déclenchée.

L'AVENIR : ENTRE INNOVATION ET MAÎTRISE DES COÛTS

L'industrie de l'IA se trouve à un carrefour. D'un côté, l'innovation continue à un rythme effréné, avec des modèles toujours plus puissants et des agents toujours plus autonomes. De l'autre, la réalité financière commence à rattraper les entreprises. La Tokenomics Foundation et les nouveaux outils de gestion pourraient bien être les clés pour trouver un équilibre. Mais pour l'instant, beaucoup d'entreprises naviguent à vue, en espérant que les solutions arriveront à temps pour éviter le naufrage.

LES SOLUTIONS QUI ÉMERGENT

Plusieurs acteurs tentent de répondre à cette crise des coûts. Pay-i se concentre sur le suivi et l'optimisation des coûts des investissements en IA générative. Paid permet aux développeurs de facturer en fonction de la valeur réelle plutôt que des abonnements. Des plateformes comme Jellyfish, Waydev et Faros AI aident à prouver le retour sur investissement des outils pour développeurs. Ramp, Datadog et New Relic intègrent désormais des fonctionnalités dédiées à la gestion des coûts IA. AWS devrait annoncer de nouvelles fonctionnalités lors de la conférence FinOps X.

LA TOKENOMICS : UNE NOUVELLE DISCIPLINE À APPRENDRE

La Tokenomics Foundation veut imposer des normes communes pour mesurer et comparer l'utilisation des tokens. Elle propose des métriques comme le coût par intelligence ou les tokens par watt. Son objectif est de rendre l'économie de l'IA plus transparente et plus maîtrisable. Mais le premier livrable n'arrivera qu'en juillet, alors que les entreprises ont besoin de solutions maintenant.

L'INDUSTRIE FACE À SES LIMITES

Les entreprises réalisent que l'IA n'est pas une solution magique sans conséquences. Les gains de productivité s'accompagnent de coûts exponentiels. Les outils de suivi et d'optimisation se multiplient, mais ils ne suffiront peut-être pas à éviter une crise financière pour les entreprises les plus exposées. La question reste entière : comment concilier innovation et maîtrise des coûts dans un monde où l'IA devient omniprésente ?

LES MODÈLES ROUTEURS : UNE PISTE PROMETTEUSE

Des solutions comme le routeur de modèles de Factory pourraient aider à optimiser les coûts. En sélectionnant automatiquement le modèle le plus adapté à chaque tâche, ces outils permettent de réduire les dépenses sans sacrifier la performance. Une tendance que les fournisseurs de modèles comme Anthropic commencent à adopter en orientant les requêtes vers des modèles moins chers.

LE DÉFI DE LA MESURE

Le vrai problème n'est pas seulement technique, mais aussi organisationnel. Les entreprises peinent à mesurer la valeur réelle de l'IA. Comment savoir si un ingénieur qui dépense 40 000 dollars en tokens par mois apporte vraiment de la valeur ? Sans une mesure précise de la performance, il est impossible de savoir si l'investissement en IA est rentable. C'est ce qui rend la situation si complexe : l'industrie a créé un outil puissant, mais elle n'a pas encore trouvé comment le mesurer et le contrôler.

LA TOKENOMICS FOUNDATION : UNE LUEUR D'ESPOIR

La Tokenomics Foundation pourrait bien être la solution dont l'industrie a besoin. En créant des normes communes et des outils de mesure, elle pourrait aider les entreprises à reprendre le contrôle de leurs dépenses IA. Mais son lancement officiel n'est prévu qu'en juillet. D'ici là, beaucoup d'entreprises vont continuer à naviguer dans le brouillard, en espérant que les solutions arrivent à temps.

L'INNOVATION À TOUT PRIX : LE PIÈGE

L'industrie de l'IA a longtemps fonctionné selon une logique de « toujours plus ». Les nouveaux modèles, toujours plus puissants, étaient adoptés sans toujours évaluer leur coût réel. Mais aujourd'hui, la facture arrive. Les entreprises qui ont cru que l'IA était une solution miracle sans conséquences financières se retrouvent aujourd'hui face à une réalité brutale. La course à l'innovation a créé un monstre financier qu'il va falloir dompter.

LES SOLUTIONS EXISTENT, MAIS SONT-ELLES À TEMPS ?

Les outils de suivi, d'optimisation et de facturation commencent à apparaître. Les normes communes se mettent en place. Mais pour beaucoup d'entreprises, il est peut-être déjà trop tard. Les budgets sont déjà explosés, et les solutions n'arrivent que maintenant. La question n'est plus de savoir si l'IA va changer l'industrie, mais comment les entreprises vont survivre à la révolution qu'elles ont elles-mêmes déclenchée.

L'APPROCHE MODÉRÉE : LA CLÉ DU SUCCÈS

Plutôt que de pousser à une adoption massive et non maîtrisée, les experts recommandent une approche modérée. Faire passer la majorité des utilisateurs d'une utilisation faible à modérée pourrait être la meilleure façon de maximiser le retour sur investissement. L'objectif n'est pas d'éliminer l'IA, mais de la rendre plus accessible et plus maîtrisable.

UN FUTUR INCERTAIN

L'industrie de l'IA se trouve à un tournant. D'un côté, l'innovation continue à un rythme effréné. De l'autre, la réalité financière commence à rattraper les entreprises. La Tokenomics Foundation et les nouveaux outils pourraient bien être les clés pour trouver un équilibre. Mais pour l'instant, beaucoup d'entreprises naviguent à vue, en espérant que les solutions arrivent à temps pour éviter le naufrage.

CE QUE LES ENTREPRISES DOIVENT FAIRE MAINTENANT

Les entreprises qui utilisent l'IA doivent agir rapidement. Mettre en place des limites strictes sur l'utilisation des tokens. Utiliser des outils de suivi et d'optimisation. Exiger des fournisseurs une transparence totale sur les coûts. Et surtout, mesurer la valeur réelle de l'IA pour leur activité. Sans ces mesures, le risque est de se retrouver avec des factures astronomiques et des budgets en lambeaux.

CONCLUSION : L'IA N'EST PAS UNE SOLUTION MAGIQUE

L'IA est un outil puissant, mais pas une solution miracle. Elle peut transformer les entreprises, mais à quel prix ? Les entreprises qui survivront à cette révolution seront celles qui sauront concilier innovation et maîtrise des coûts. Les autres risquent de se retrouver englouties par la facture. Le choix est simple : soit on apprend à dompter l'IA, soit on se fait dominer par elle.

Sources :
  • TechCrunch AI

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO