Fin de l'ère de l'IA débridée
En 2026, l’ère de l’intelligence artificielle illimitée s’achève. Entre février et juin, les principaux fournisseurs comme OpenAI, Anthropic et GitHub ont transformé leurs modèles de tarification, passant d’une facturation forfaitaire à une facturation à l’usage, mesurée en jetons qui correspondent aux données d’entrée et de sortie du modèle. Cette transition a provoqué une flambée des coûts pour les entreprises qui avaient massivement adopté ces outils sans anticiper les dépenses réelles. Coinbase a été l’une des premières confrontées à ce constat. Après une adoption exponentielle de son modèle de codage, la société a dû instaurer des plafonds hebdomadaires variant de 500 à 5 000 dollars selon les postes. Le responsable de l’infrastructure, Rob Witoff, souligne que la priorité a basculé de l’adoption massive à l’usage optimal. D’autres géants comme Salesforce, Walmart et Amazon ont rapidement imposé des limites, tandis qu’Uber a dépassé son budget annuel sans voir de retombées concrètes. Face à ces coûts imprévus, les entreprises réorganisent leurs processus. Les développeurs doivent désormais rédiger des requêtes plus ciblées et fractionner les tâches complexes, au lieu de confier des instructions autonomes à des modèles coûteux. Des initiatives visant à harmoniser les métriques budgétaires ont été lancées par des acteurs comme Accenture et IBM. Une enquête récente révèle que la majorité des dirigeants craignent des restrictions budgétaires, car les dépenses en IA ne génèrent pas toujours de revenus directs. Les fournisseurs justifient ce virage par l’insoutenabilité de leurs anciens modèles. Malgré la baisse du coût des puces informatiques, l’explosion du nombre d’utilisateurs et l’essor des agents autonomes ont rendu la subvention des gros consommateurs financièrement impossible. Pour atténuer l’impact, OpenAI et Anthropic promeuvent des modèles plus efficaces en jetons, proposent des options de traitement différé à moindre coût et introduisent la mise en cache des requêtes pour réduire la puissance de calcul nécessaire. Dans ce nouvel environnement, la recherche de rentabilité domine. Des entreprises comme LogicMonitor et Harness limitent strictement l’usage des modèles premium, privilégiant des solutions moins onéreuses pour les tâches courantes. Certains recourent même à des alternatives internationales moins chères. Cette transition marque un tournant vers une IA plus mesurée et orientée vers la valeur ajoutée. Les dirigeants adoptent désormais une approche prudente, axée sur la mesure précise du retour sur investissement et l’optimisation des ressources. L’ère du gaspillage technologique fait place à une gestion rigoureuse, transformant durablement la relation entre les entreprises et l’intelligence artificielle.
