HyperAI超神经
Back to Headlines

OpenAI 探索多代理架构:优化复杂任务处理与成本控制的新方法

3 days ago

近日,OpenAI 展示了他们创建深度研究 AI 代理架构的理想场景。在这个架构中,核心考虑之一是如何在单个 AI 代理的工具数量与多个 AI 代理之间的协作之间找到最佳平衡点。如果将所有工具都集中在同一个 AI 代理中,可能会导致工具选择困难,NVIDIA 在此方面进行了大量研究,通过微调语言模型来提高工具选择的准确性。 OpenAI 的思路是采用多个 AI 代理的协作与编排。在这个架构中,每个 AI 代理负责不同的任务,使用适合各自任务的语言模型。这不仅提高了效率,减少了成本,还确保了 AI 系统在应用中的可扩展性。具体来说,这些 AI 代理在处理需要战略规划、多源信息整合、专业工具集成或多层次多步骤推理的任务时表现出色,例如深入市场分析、复杂代码调试或生成全面的研究报告。它们能够将问题分解成更小的部分,进行迭代处理,并适应不断变化的上下文,从而输出更加精细的结果。 对于日常需求,如快速检索事实、简单的问答交流或简短的对话互动,建议继续使用标准的 OpenAI 聊天完成 API。这个简单的接口不仅适用于高频率或低复杂度的使用场景,而且没有多代理系统带来的额外延迟。 OpenAI 推荐了一个四代理的深度研究管道: 分诊代理:首先检查用户查询的内容。如果发现缺乏关键信息,会将其交给澄清代理进一步探究;否则直接传递给指令代理处理。 澄清代理:通过提出关键的跟进问题来澄清信息,等待用户(或模拟响应)提供所需答案。 指令构建代理:将澄清后的输入转化为精细的研究概要,以便后续处理。 研究代理:使用 WebSearchTool 进行大规模网络研究,同时检查内部知识库中的相关资料。在整个过程中,研究代理会实时输出中间事件,确保透明度。最后,它会提交经过打磨的研究成果。 此外,OpenAI 提供了一个名为 print_agent_interaction(在 OpenAI 官方指南中也称为 parse_agent_interaction_flow)的功能,有助于可视化和调试多代理系统的动态工作流程。该功能接收 AI 代理事件流作为输入,逐项打印活动序列,包括代理间的交接、工具调用、推理步骤和消息输出,便于开发者跟踪整个过程。这就像一个简易的跟踪日志,省略无关细节的同时突出代理之间的重要交互。 未来,OpenAI 计划进一步探索不同组织内的 AI 代理如何进行跨组织协作,以及如何将 AI 代理更好地融入人类的复杂网络浏览和操作系统导航活动中。这些举措有望为 AI 代理的应用带来更大的灵活性和实用性。 业内专家对此给予高度评价,认为这是 AI 领域的重要进展。Kore.ai 的首席布道师 Cobus Greyling 表示,这些技术正在塑造未来的人机交互方式,特别是在语言模型、AI 代理和自代理应用等方面。Kore.ai 是一家专注于智能对话解决方案的公司,致力于通过 AI 技术提高生产力和客户体验。

Related Links