HyperAIHyperAI

Command Palette

Search for a command to run...

コインベースCEO、トークン制限なくAIコストを削減

大手暗号資産取引所コインベースのブライアン・アーモング最高経営責任者(CEO)は、AI利用に伴うコスト増を抑えながらエンジニアのトークン消費を制限しないための五つの戦略を公表した。アーモングCEOはXプラットフォームへの投稿で、同社がAIインフラの効率化を通じて持続可能な成長基盤を整備していることを示し、トークン使用量が社史上最高水準に達した一方で、AI関連支出はピーク時のほぼ半分に抑制されたとのデータを提示した。 同氏が打ち出したコスト最適化戦略の第一はデフォルト大規模言語モデル(LLM)の選択変更である。AnthropicやOpenAIといった米国の最先端モデルに依存する代わりに、Z.aiやMoonshot AI製のGLM 5.2やKimi 2.7などの中国製オープンウェイトモデルをゲートウェイ経由で標準採用する実験を実施中だ。第二の戦略はタスク難易度に応じた自動ラウティングの導入である。計画立案には高性能モデルを、反復的な実行タスクには軽量モデルを割り当てるなど、人間による手動選定を排しAIが最適モデルを動的に判定する仕組みを構築する。第三と第四は推論コスト削減のためのキャッシュ最適化とコンテキスト管理の簡素化である。タスクを跨ぐ際は新しいセッションを開始して履歴の肥大化を防ぐ。第五の戦略は支出の透明性向上である。使用量に上限を設けない代わりに全エンジニアの消費データを可視化し、コスト効率の高い業務インパクトを促進する評価軸を設けた。 この取り組みは業界全体の効率化トレンドと一致する。無制限なトークン消費を助長する風潮から、コスト管理と自動化の徹底へと方針が転換している。アーモングCEOは今年5月、AI活用により開発サイクルが大幅に短縮されたことを評価する一方、業務効率化に伴う人員整理(約一四%)を実施した経緯にも言及。「使用抑制が目的ではなく、指数関数的な成長を支えるインフラ整備こそが目標だ」と強調し、制限型の運用からスマート・ルーティングと可視化に基づく持続可能なAI活用のモデルケースを提示した。

関連リンク