HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA 推出 NeMo Retriever 实现通用Agent检索

英伟达 NeMo Retriever 团队宣布,其最新开发的智能检索管道在 ViDoRe v3 排行榜上夺得第一,并在高难度的 BRIGHT 推理排行榜上获得第二。这一成果证明了该方案在通用性与适应性上的显著优势。 传统检索主要依赖语义相似度,但在处理复杂文档和深度推理时往往力不从心。为突破这一瓶颈,NeMo 团队构建了基于 ReACT 架构的Agent检索管道。该管道通过大语言模型与检索器之间的动态交互循环,自主规划、迭代搜索并评估结果,而非依赖单一查询。当Agent遇到步骤限制时,系统会自动切换至互惠秩融合(RRF)机制作为安全兜底,确保任务完成。 在工程实现上,团队摒弃了传统的模型上下文协议(MCP)服务器架构,转而采用线程安全的单例检索器。这一改进消除了网络传输延迟和进程配置复杂性,大幅提升了 GPU 利用率和实验吞吐量,使高性能Agent检索得以在大规模基准测试中高效运行。 测试数据显示,该管道展现出极强的泛化能力。在聚焦复杂视觉布局的 ViDoRe v3 任务中,NeMo 以 69.22 分的 NDCG@10 指数超越对手,而竞争对手在同一数据集的其他领域表现则出现明显下滑。虽然Agent检索的单次查询耗时(约 136 秒)和成本高于传统密集检索,但其在复杂逻辑和视觉理解任务中的表现无可替代。 英伟达指出,未来的优化重点在于通过蒸馏技术将复杂的推理模式迁移至更小的开源模型,以降低延迟和成本。目前,该模块支持灵活配置,开发者可结合不同的大语言模型与英伟达商业嵌入模型,构建适合企业需求的高通用性检索工作流。

相关链接

NVIDIA 推出 NeMo Retriever 实现通用Agent检索 | 热门资讯 | HyperAI超神经