Comment le « tokenmaxxing » transforme l'usage de l'IA en compétition chez les géants de la tech

Le mot est apparu dans les colonnes d’Hacker News début 2026, avant d’exploser dans un article du New York Times le 20 mars. Le « tokenmaxxing » désigne une pratique née dans la Silicon Valley : consommer un maximum de tokens d’intelligence artificielle (Claude, ChatGPT, Gemini, Codex) pour afficher sa productivité et grimper dans les classements internes. Accessoirement, ça justifie aussi les milliards investis dans l’IA par les dirigeants. Un token, c’est environ les trois quarts d’un mot en anglais. Et dans certaines entreprises, en brûler plus que son voisin est devenu un marqueur de statut aussi visible que l’était une Tesla sur le parking dans les années 2010.

Le cas Meta : 60 trillions de tokens et un tableau d’honneur

En avril 2026, The Information révélait l’existence de « Claudeonomics », un tableau de bord créé par un employé de Meta sur l’intranet. Le principe : tracker la consommation de tokens Claude des quelque 85 000 salariés de l’entreprise et afficher les 250 plus gros consommateurs. Des titres gamifiés comme « Token Legend » ou « Session Immortal » récompensaient les plus voraces. Le champion : 281 milliards de tokens en 30 jours (de quoi remplir Wikipédia 33 fois, pour donner une échelle). Le tableau a été fermé après les fuites, mais le phénomène dépasse largement Meta.

Chez Amazon, 80 % des développeurs doivent utiliser l’agent IA interne chaque semaine. Certains lancent des agents inutiles juste pour gonfler le compteur. Chez Salesforce, un widget Mac affiche la dépense IA personnelle actualisée toutes les 15 minutes, avec un objectif minimum. Jensen Huang (Nvidia) propose carrément d’intégrer un budget tokens dans les packages de rémunération, au même titre qu’une prime à l’embauche. Sa formule : un ingénieur à 500 000 dollars qui ne consomme pas 250 000 dollars de tokens devrait « profondément l’alarmer ».

Produire plus vite, mais à quel prix

Le problème, c’est que brûler des tokens n’est pas synonyme de produire mieux. Une étude Faros AI menée sur 22 000 développeurs montre que le taux de code supprimé après avoir été fusionné (« code churn ») a augmenté de 861 % dans les équipes à forte adoption IA. Autrement dit, on produit beaucoup plus vite du code qu’on jette ensuite beaucoup plus vite aussi.

En France, le phénomène reste pour l’instant discret. Aucune entreprise n’a publiquement déployé de leaderboard similaire. Mais Mistral vient de signer 40 000 licences avec la Caisse des Dépôts, et les abonnements IA se généralisent dans les DSI françaises. Auditionné à l’Assemblée Nationale, son cofondateur déclarait d’ailleurs que « les ingénieurs chez Mistral n’écrivent plus de lignes de code ». La question finira par se poser ici aussi : combien de tokens brûle-t-on, et pour quel résultat ? Les années 80 avaient la métrique des lignes de code. Les années 2020 ont les tokens. L’histoire se répète, juste avec des zéros en plus.

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.

Naïm Bada