GoogleがGemini Deep Researchを刷新、開発者向けAPIでエージェントAI時代へ本格進出
グーグルは、同社が最も進化したAI研究エージェント「Gemini Deep Research」の新版を発表した。発表日は、OpenAIがGPT-5.2(通称「Garlic」)を発表した日と同日。新バージョンは、同社の最新基盤モデル「Gemini 3 Pro」を活用し、従来の研究レポート作成にとどまらず、開発者が自社アプリにグーグルの高度な情報分析能力を組み込むことが可能になった。この実現を支えるのが、開発者に柔軟な制御権を提供する「Interactions API」である。 新エージェントは、膨大な情報を統合し、長文のコンテキストを処理する能力に優れ、顧客からはM&Aのデューデリジェンスやドラッグ毒性評価といった高度な業務に活用されている。今後、Google SearchやGoogle Finance、Geminiアプリ、NotebookLMといったサービスへの統合も予定されている。これは、将来的にはユーザーが直接検索せず、AIエージェントが代わりに情報を収集・分析する時代への布石と見なされている。 グーグルは、Gemini 3 Proが「最も正確なモデル」として設計されており、複雑な推論タスクにおける「ハルシネーション」(事実を捏造する現象)を最小限に抑えると強調している。特に、長時間にわたる自律的推論を要するエージェントタスクでは、一回の誤った判断が全体の信頼性を損なうリスクが高いため、この点は極めて重要である。 実力証明として、グーグルは新ベンチマーク「DeepSearchQA」を公開。これは複数ステップにわたる情報探索タスクを評価するもので、さらに「Humanity’s Last Exam」という極めて難解な知識テスト、およびブラウザ上で動作するエージェントの能力を測る「BrowserComp」にも挑戦。結果、グーグルのエージェントは自社ベンチマークとHumanity’s Last Examで優位を保ったが、OpenAIのChatGPT 5 ProがBrowserCompではわずかに上回り、驚きの競争力を示した。 しかし、その結果は発表直後に時代遅れとなった。なぜなら、同日OpenAIがGPT-5.2を正式リリースしたためだ。同モデルは、自社ベンチマークを含む多数のテストで競合を上回ると主張しており、特にグーグルとの差を強調。このタイミングの選定は、AI競争の激化を象徴するものであり、両社の技術力と戦略的意図が、今後も注目される。
