Weave Router : routeur LLM open-source qui réduit les coûts
Weave, éditeur de solutions informatiques déjà adoptées par Robinhood et PostHog, a déployé un routeur de modèles d'intelligence artificielle baptisé workweave/router. Cet outil open source agit comme un proxy centralisé capable d'acheminer chaque requête vers le modèle de langage optimal, qu'il provienne d'Anthropic, d'OpenAI, de Google Gemini ou de la communauté open source. Le routeur se distingue par son moteur de décision local, qui analyse les requêtes en moins de cinquante millisecondes pour sélectionner le modèle le plus adapté, écartant ainsi les méthodes de sélection purement heuristiques. Les résultats mis en avant par l'éditeur soulignent une réduction des coûts computationnels comprise entre 40 et 70 pour cent, sans perte de performance. Ce gain d'efficacité a permis au projet de figurer en première position du classement RouterArena, notamment sur le critère combinant qualité et coût. Conformément aux standards du secteur, le proxy prend en charge le streaming, l'analyse visuelle et l'exécution d'outils complexes. Par mesure de sécurité, les clés API des fournisseurs sont conservées exclusivement sur les appareils des utilisateurs et chiffrées au repos. Conçu pour simplifier le développement, le routeur s'intègre directement dans les assistants de codage IA courants tels que Claude Code, Codex, opencode et Cursor. Une configuration rapide via Node.js permet de basculer instantanément entre un accès routé et un appel direct au fournisseur, selon les besoins du développeur. Pour le suivi opérationnel, une observation complète des requêtes est disponible nativement et s'interconnecte avec les tableaux de bord d'observabilité professionnels comme Datadog ou Grafana. Cette publication s'inscrit dans une tendance marquée par la multiplication des fournisseurs d'IA et la nécessité pour les équipes techniques d'optimiser leurs dépenses tout en garantissant la fiabilité des systèmes agents. En uniformisant les appels via une unique interface, Weave réduit la complexité d'intégration tout en offrant la flexibilité requise par les architectures modernes de développement logiciel.
