Une tendance surprenante a émergé cette année dans la Silicon Valley : les dirigeants technologiques évaluent la productivité de leurs employés en fonction du nombre de tokens d'IA qu'ils utilisent. Surnommée avec ironie « tokenmaxxing », cette pratique illustre l'engouement démesuré pour l'IA, utilisée à tout prix et sans limite. Pourtant, ce qui a longtemps semblé être un accès quasi gratuit aux modèles d'IA pourrait bientôt toucher à sa fin.
Les retards dans la construction des centres de données dédiés à l'IA ont révélé un problème majeur : l'accès à la puissance de calcul, indispensable au fonctionnement des modèles les plus avancés. Alors que les coûts explosent, les entreprises consommatrices d'IA pourraient bientôt devoir assumer des factures exorbitantes. Des sociétés comme OpenAI et Anthropic préparent déjà des hausses de prix pour limiter leurs pertes.
Cette situation marque un tournant après des années d'accès presque gratuit aux technologies d'IA de pointe, une pratique qui masquait souvent leur véritable coût. « Est-ce que l'ère de l'IA quasi gratuite touche à sa fin ? », s'interroge Mark Riedl, professeur à Georgia Tech, dans une interview accordée à The Verge. « Il est encore trop tôt pour le confirmer, mais certains signes le suggèrent. »
Récemment, Anthropic a suspendu l'accès de millions d'utilisateurs à son outil OpenClaw, après avoir poussé ses systèmes à leurs limites. « Nous avons travaillé dur pour répondre à l'augmentation de la demande pour Claude, mais nos abonnements n'étaient pas conçus pour les modèles d'utilisation de ces outils tiers », a expliqué Boris Cherny, responsable de Claude Code, sur X. « La capacité est une ressource que nous gérons avec soin, et nous privilégions nos clients utilisant nos produits et notre API. »
Pour générer suffisamment de revenus et couvrir les milliards investis dans les centres de données, les entreprises d'IA devront atteindre un chiffre d'affaires annuel proche de 2 000 milliards de dollars d'ici 2029, selon les estimations de Will Sommer, expert en économie de l'IA et directeur principal chez Gartner. Un objectif ambitieux, compte tenu des marges actuelles : avec un bénéfice de 10 % par token, la consommation de tokens devrait augmenter de 50 000 à 100 000 fois d'ici 2030, un rythme de croissance quasi impossible à atteindre.
Pour l'instant, les entreprises subissent des pertes colossales en augmentant leur capacité de calcul, en raison des coûts exorbitants des centres de données. Pire encore, les modèles d'IA devenant plus complexes, ils nécessiteront encore plus de ressources, un défi aggravé par l'essor des agents IA. Malgré une bataille acharnée pour le leadership, avec Anthropic récemment dépassant les 1 000 milliards de dollars de valorisation, une hausse agressive des prix ou l'introduction de publicités pourrait effrayer les clients et freiner la croissance.