HyperAIHyperAI

Command Palette

Search for a command to run...

1日前
LLM

エージェント向けAIルーター公開、50msで最適選択・コスト削減

エンジニアリングインテリジェンスプラットフォームのWeaveは、エージェントシステム向けの新規モデルルーティングプロキシ「workweave/router」を発表した。同ツールは、各プロンプトを50ミリ秒以内に最適化された大規模言語モデルに振り分け、従来比で40から70%のコスト削減を実現する。 技術的基盤として、デバイス内に埋め込みモデルをローカルに保持し、Avengers-Proの研究フレームワークに基づくクラスタースコアラーでリクエストを評価する。感情や曖昧な指示に依存せず、データ駆動型の判断でAnthropic、OpenAI、Gemini、および互換エンドポイント経由のオープンソースモデルなどをシームレスに切り替える。APIはAnthropicメッセージ、OpenAIチャット補完、Geminiネイティブ形式に対応し、ストリーミングやビジョン、ツール呼び出しもそのまま利用可能だ。 セキュリティと運用面では、APIキーはユーザー環境下に保存され、転送時に暗号化される標準のBYOKアーキテクチャを採用。OTLP出力に対応したトレーシング機能を内蔵し、WeaveダッシュボードやDatadog、Grafanaなどの既存監視ツールとの連携も容易である。Claude Code、Codex、opencode、Cursorといった主要AIプログラミングエージェントとの設定ファイル自動整合対応や、ワンコマンドでのクイックセットアップを提供し、開発フローへの統合障壁を大幅に低下させた。 RouterArenaのベンチマークではAcc-Cost Arena部門で76.09を獲得し、ルーティング精度と効率性のバランスで業界上位に位置する。エンドポイントの変更のみで既存LLMインフラの最適化を進められる本ソリューションは、エージェントベースの開発環境におけるコスト管理とパフォーマンス制御の標準となる可能性を秘めている。

関連リンク