HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 15 jours
Capital-risque

Routage IA : levée explosive

Face à la flambée des coûts liés à l'utilisation des modèles d'intelligence artificielle, les startups spécialisées dans le routage d'IA connaissent un essor significatif. Ces plateformes permettent aux développeurs de diriger automatiquement leurs requêtes vers différents modèles, d'optimiser les dépenses et de gérer les pannes. La demande explose, attirant des investissements majeurs. En mai, OpenRouter a levé 113 millions de dollars, atteignant une valorisation de 1,3 milliard de dollars. Peu après, Concentrate AI est sorti de sa phase confidentielle avec plus de 5 millions de dollars de financement, répondant à la complexité croissante du paysage des modèles disponibles. Les outils de codage et les applications génératives ont provoqué une forte augmentation de la consommation de tokens, les unités de mesure des données d'entrée et de sortie des systèmes d'IA. Les fournisseurs comme OpenAI et Anthropic facturant à l'usage, de nombreuses entreprises subissent un choc budgétaire. Les plateformes de routage contournent ce problème en agrégant l'accès aux modèles de pointe ainsi qu'à des alternatives économiques proposées par des fournisseurs tels que Google, DeepSeek, MiniMax ou Xiaomi. Cette approche centralisée offre une flexibilité que les clouds traditionnels n'offrent pas toujours, malgré les outils existants d'Amazon Web Services, Microsoft et Google Cloud. Des acteurs comme Vercel ont d'ailleurs développé leurs propres solutions après en avoir mesuré l'utilité en interne. Cette convergence technologique a également provoqué un changement rapide de préférence dans le choix des modèles. Aux printemps derniers, les nouvelles versions V4 du laboratoire chinois DeepSeek ont suscité un vif intérêt pour leur rapport performance-coût élevé. Sur les plateformes de routage, ces modèles coûtaient une fraction du prix des alternatives établies comme Haiku d'Anthropic. Cette attractivité s'est traduite par une hausse fulgurante de leur utilisation : à la mi-mai, DeepSeek avait déjà dépassé Claude en volume de tokens traités sur OpenRouter et Vercel. Si certaines entreprises expriment des inquiétudes concernant la sécurité des modèles chinois, la plupart de ces infrastructures sont hébergées sur des serveurs américains, rassurant ainsi les équipes techniques. Les experts du secteur s'accordent à dire que la gestion des coûts d'IA deviendra un critère stratégique permanent, comparable à l'optimisation des effectifs humains. Les solutions d'observabilité et de tunage des tokens, récemment lancées par des entreprises comme Lanai, confirment cette tendance vers une adoption plus ciblée et économique des technologies génératives. Alors que le marché continue de se fragmenter et d'innover, le routage d'IA s'impose comme une infrastructure essentielle pour garantir la viabilité économique des projets technologiques modernes.

Liens associés

Routage IA : levée explosive | Articles tendance | HyperAI