Googleが新AI「Gemini Deep Think」をリリース。複数のアイデアを並列で検証する推論モデルをGeminiアプリで体験可能に。
Google DeepMindは、AIの推論能力を飛躍的に向上させた新モデル「Gemini 2.5 Deep Think」の提供を開始した。このモデルは、複数のAIエージェントを並列で起動し、複数の思考経路を同時に探索・評価することで、より優れた答えを導き出す「マルチエージェント型推論」を採用。Googleは、このアプローチが人間の複雑な問題解決プロセスに類似していると説明し、従来の単一エージェントモデルに比べて、創造性や戦略的計画、段階的改善に優れていると強調している。2025年5月のGoogle I/Oで初公開され、今後は月額250ドルの「Ultra」サブスクリプション会員が、金曜日からGeminiアプリで利用可能になる。 Gemini 2.5 Deep Thinkは、国際数学オリンピック(IMO)で金メダルを獲得したモデルの進化版であり、数学的推論に特化したバージョンも一部の数学者や研究者に限定公開されている。このIMO専用モデルは数時間にわたる推論を実行するため、通常のAIモデルが数秒から数分で答えるのに対し、非常に長時間の「思考時間」を要する。Googleは、このモデルが学術研究の支援に役立つと期待しており、フィードバックを通じてマルチエージェントシステムの改善を目指している。 ベンチマークテストでは、Gemini 2.5 Deep Thinkは「Humanity’s Last Exam(HLE)」で34.8%の正解率を達成。これはxAIのGrok 4(25.4%)やOpenAIのo3(20.3%)を大きく上回る成果。また、競技プログラミングを測るLiveCodeBench6では87.6%と、Grok 4(79%)やo3(72%)を上回り、実用的なコーディング能力の高さを証明している。さらに、コード実行やGoogle検索などのツールと連携可能で、従来のAIよりも大幅に長く、詳細な回答を生成できる。 Googleは、Gemini 2.5 Deep Thinkが「拡張された推論時間」と「新開発の強化学習技術」によって、より効果的な思考経路を学習・活用できると説明。複数のアイデアを同時に生成・比較・統合する能力により、Web開発や研究課題の解決に貢献する可能性がある。実際に生成されたアートやウェブコンテンツは、詳細さと美しさにおいて他モデルを凌駕している。 マルチエージェントアプローチは、AI業界の共通のトレンドになりつつある。Elon MuskのxAIも同様のGrok 4 Heavyを発表し、OpenAIもIMO金メダル獲得モデルがマルチエージェントであると明言。AnthropicのResearch Agentも同様の仕組みを採用。しかし、計算リソースを大幅に消費するため、高コストであり、GoogleやxAIが高額サブスクリプションに限定する戦略は必然的だ。今後数週間、GoogleはGemini APIを通じて一部の開発者や企業にテスト提供し、実際の利用状況を把握する予定。