HyperAIHyperAI

Command Palette

Search for a command to run...

100兆トークンのデータが暴くAIの真実:中型モデルの台頭とエージェント型推論の到来

2025年12月、ベンチャーキャピタルのa16zとAI推論プラットフォームOpenRouterが共同発表した『State of AI』報告書が、AIの実際の利用状況を明らかにした。この報告書は、OpenRouter上で過去1年間に実行された100兆トークン以上のユーザー行動データに基づくもので、モデル選択、使用シーン、コスト感度、地理的分布といった多角的な分析を実施。データは提示文や出力内容ではなく、時間、モデル選択、トークン消費量、ツール呼び出し状況といったメタデータのみを対象としており、実際のユーザー行動を広範に捉えることに成功している。 まず注目すべきは、オープンソースモデルの急成長だ。報告書によると、2025年末時点でオープンソースモデル(OSS)のトークン消費シェアは約30%に達しており、1年前に比べて急激な伸びを見せた。特に中国開発のモデル群が顕著な影響力を発揮しており、DeepSeek、通義千問(Qwen)、月之暗面(Moonshot AI)のKimiシリーズなどが海外開発者からの利用を牽引。中国モデルの年間平均シェアは約13%、非中国モデルとほぼ同水準に達しており、オープンソース領域で中美が並立する「二極構造」が形成された。 モデルサイズの観点では、中型モデル(15B~70Bパラメータ)の利用が急増している。小型モデルのシェアは減少傾向にある一方、中型モデルは2024年11月にQwen2.5 Coder 32Bの登場を契機に本格的な成長を始めた。この傾向は、「性能とコストのバランス」を求めるユーザーのニーズを反映しており、特にコード生成や複雑な推論に適したモデルとして定着しつつある。 使用シーンにおいては、驚きの傾向が浮き彫りになった。オープンソースモデルでは、トークン消費の半数以上が「ロールプレイ」や物語創作、仮想対話といったエンタメ用途に集中。これは、オープンソースモデルが自由度の高い微調整が可能で、商業的なフィルタリングが緩いため、感情表現やスタイルの柔軟性に優れているためだと解釈されている。一方、プログラミングは閉鎖型モデルを含めると全体の使用量が50%を超えるまで成長し、AnthropicのClaudeシリーズが60%以上のシェアを維持。OpenAIやGoogleもシェアを拡大しており、これはAI開発の「戦略的基盤」としての重要性を示している。 さらに重要なのは、「エージェント型推論」(Agentic Inference)の普及だ。モデルが単なる文章生成ではなく、複数ステップの計画、外部ツールの呼び出し、長期間のコンテキスト保持を実行する仕組みへの移行が進んでいる。推論最適化モデル(o1、GPT-5、Claude 4.5など)のトークン消費シェアは、2025年初頭から50%以上に達しており、平均提示長も約4倍に拡大。これは「創造主」から「分析エンジン」への転換を意味する。 地理的には、アジアのシェアが31%まで上昇し、世界のAI利用の中心が多極化していることが明らかになった。また、コストに対する需要の感度は低く、価格変動に対して使用量の変化はわずかにとどまるため、モデルの差別化が依然として重要である。 報告書の最も興味深い洞察は「灰姫の水晶靴効果」——つまり、特定のモデルが特定の課題に「ぴったり合う」瞬間が存在し、そのタイミングでユーザーが強くロックインする現象だ。Gemini 2.5 ProやClaude 4 Sonnetはその典型的な例であり、初期のユーザー群がその後も高い維持率を示している。一方、初期から「十分良い」モデルに留まったものは、ユーザーの離脱が顕著だった。 結論として、AIの利用は「多モデル戦略」「エンタメとの融合」「エージェント型推論の標準化」「グローバル化」といったトレンドを背景に、かつてないほど複雑かつ多様化している。今後の競争は、技術的優位性だけでなく、文化的適合性や使いやすさ、長期的な信頼性にかかっている。

関連リンク