HyperAIHyperAI

Command Palette

Search for a command to run...

谷歌发布Deep Research更新,直面OpenAI GPT-5.2挑战

谷歌在周四推出其最新版研究型AI代理Gemini Deep Research,基于其最新旗舰模型Gemini 3 Pro,被称作“有史以来最深入的AI研究代理”。这一升级不仅保留了生成研究报告的能力,更关键的是,谷歌通过新推出的Interactions API,首次允许开发者将Gemini的深度研究能力嵌入自有应用,标志着AI代理生态进入新阶段。 新版本Gemini Deep Research具备处理海量信息和超长上下文输入的能力,适用于尽职调查、药物毒性安全研究等复杂任务。谷歌表示,该工具未来将集成至Google Search、Google Finance、Gemini App及NotebookLM等核心服务中,推动“人类不再直接搜索,而是由AI代理代劳”的未来图景。 Gemini 3 Pro作为当前谷歌最“可靠”的模型,特别优化了减少AI“幻觉”问题——即模型虚构信息——在长时间、多步骤推理任务中尤为重要。谷歌为此开发了名为DeepSearchQA的新基准测试,专门评估AI代理在复杂信息检索任务中的表现,并已开源。此外,测试还涵盖更具挑战性的“人类最后的考试”(Humanity’s Last Exam)和浏览器操作任务基准BrowserComp。结果显示,Gemini Deep Research在自研和“人类最后的考试”中领先,但OpenAI的ChatGPT 5 Pro表现强劲,甚至在BrowserComp上略胜一筹。 然而,这些测试结果发布后几乎立刻过时。因为就在同一天,OpenAI正式推出其备受期待的GPT-5.2(代号Garlic),宣称在多项主流基准测试中全面超越对手,尤其在与谷歌的对比中占据优势。这一时间点的巧合,凸显了AI巨头间激烈竞争的节奏:谷歌本意借发布新工具抢占先机,却在发布瞬间被OpenAI的重磅更新“反超”。这场“时间战”也反映出当前AI发展已进入“发布即过时”的快节奏时代。

相关链接