HyperAI超神经

谷歌在周四推出其最新版研究型AI代理Gemini Deep Research，基于其最新旗舰模型Gemini 3 Pro，被称作“有史以来最深入的AI研究代理”。这一升级不仅保留了生成研究报告的能力，更关键的是，谷歌通过新推出的Interactions API，首次允许开发者将Gemini的深度研究能力嵌入自有应用，标志着AI代理生态进入新阶段。新版本Gemini Deep Research具备处理海量信息和超长上下文输入的能力，适用于尽职调查、药物毒性安全研究等复杂任务。谷歌表示，该工具未来将集成至Google Search、Google Finance、Gemini App及NotebookLM等核心服务中，推动“人类不再直接搜索，而是由AI代理代劳”的未来图景。 Gemini 3 Pro作为当前谷歌最“可靠”的模型，特别优化了减少AI“幻觉”问题——即模型虚构信息——在长时间、多步骤推理任务中尤为重要。谷歌为此开发了名为DeepSearchQA的新基准测试，专门评估AI代理在复杂信息检索任务中的表现，并已开源。此外，测试还涵盖更具挑战性的“人类最后的考试”（Humanity’s Last Exam）和浏览器操作任务基准BrowserComp。结果显示，Gemini Deep Research在自研和“人类最后的考试”中领先，但OpenAI的ChatGPT 5 Pro表现强劲，甚至在BrowserComp上略胜一筹。然而，这些测试结果发布后几乎立刻过时。因为就在同一天，OpenAI正式推出其备受期待的GPT-5.2（代号Garlic），宣称在多项主流基准测试中全面超越对手，尤其在与谷歌的对比中占据优势。这一时间点的巧合，凸显了AI巨头间激烈竞争的节奏：谷歌本意借发布新工具抢占先机，却在发布瞬间被OpenAI的重磅更新“反超”。这场“时间战”也反映出当前AI发展已进入“发布即过时”的快节奏时代。

相关链接

相关链接

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

Command Palette

谷歌发布Deep Research更新，直面OpenAI GPT-5.2挑战

相关链接

Command Palette

谷歌发布Deep Research更新，直面OpenAI GPT-5.2挑战

相关链接

Command Palette

谷歌发布Deep Research更新，直面OpenAI GPT-5.2挑战

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化