NVIDIA 推出与模型无关的深度学习研究框架,加速AI创新
NVIDIA近日推出通用深度研究框架(Universal Deep Research, UDR),旨在解决当前生成式AI在深度研究领域面临的复杂性与依赖性问题。随着语言模型在编程、智能体工作流和深度研究等场景的广泛应用,深度研究因其能处理复杂、细致的用户输入,结合多源信息并按指定格式输出(如白皮书、摘要报告等),逐渐成为关键应用方向。相比普通问答,深度研究更少受幻觉和偏见影响,且因基于用户真实兴趣,内容通常经过充分验证。 然而,当前主流深度研究系统(如OpenAI的API和ChatGPT)依赖高度复杂的后台架构,由多个模型协同完成消歧、重述、澄清等任务,但其核心仍是一个“黑箱”式的单一语言模型,掌控着状态管理、工具调用、函数选择和推理决策,缺乏透明度与可控性。这种模式对企业的合规性、数据安全和系统可审计性构成挑战,尤其在企业级应用中风险显著。 NVIDIA的UDR框架则提供了一种模型无关的解决方案。它是一个通用型智能体框架,可无缝集成任意语言模型,无需额外微调即可运行,极大提升了系统独立性与可持续性。用户可选择自托管开源模型或私有部署实例,避免对单一供应商的依赖,降低模型迭代或淘汰带来的风险。 UDR将整个研究流程拆解为四个核心模块:状态管理、工具调用、推理机制与策略执行。它不再依赖不断膨胀的上下文窗口,而是将中间结果以命名变量形式保存在代码执行环境中,实现高效、可追溯的状态管理,实测仅需8k令牌上下文即可完成复杂研究任务。工具调用采用同步函数调用方式,操作透明、可预测,且能跨步骤复用历史数据。推理任务不再由语言模型“一言堂”主导,而是作为可调用的专用工具,仅在特定阶段执行摘要、排序或信息提取等任务,实现更精准、可控的流程控制。 这一架构赋予用户完全自定义和迭代研究策略的能力,无需训练或微调模型,真正实现“模型无关、策略自主”的深度研究范式,为构建安全、可审计、可扩展的企业级AI研究系统提供了新路径。
