13 天前
Nexus:一种轻量级且可扩展的多Agent框架,用于复杂任务自动化
Humza Sami, Mubashir ul Islam, Samy Charas, Asav Gandhi, Pierre-Emmanuel Gaillardon, Valerio Tenace

摘要
近年来,大型语言模型(Large Language Models, LLMs)的快速发展显著提升了多智能体系统(Multi-Agent Systems, MASs)的能力,使得系统不仅能够实现任务自动化,还能具备接近人类水平的推理能力。为实现这一目标,基于LLM的多智能体系统必须依托两大核心原则:(i)一种能够充分挖掘LLM在特定任务或相关任务集合中潜力的稳健架构;(ii)一种有效赋予LLM执行任务与高效管理信息所需能力的方法论。显然,预先设定的架构设计会限制特定MAS系统的可扩展性与领域适应性。针对上述挑战,本文提出Nexus:一个轻量级的Python框架,旨在简化基于LLM的多智能体系统的构建与管理。Nexus引入了三项关键创新:(i)灵活的多层级监督者架构;(ii)简化的任务流程设计;(iii)便捷的安装方式与开放源代码的灵活性——Nexus可通过pip轻松安装,并采用宽松的开源许可证发布,允许用户自由修改与扩展其功能。实验结果表明,基于Nexus构建的系统在多个领域均展现出业界领先的表现。在代码生成任务中,Nexus驱动的多智能体系统在HumanEval基准上达到99%的通过率,在VerilogEval-Human基准上实现100%的完美通过率,显著优于当前先进的推理型语言模型(如o3-mini和DeepSeek-R1)。此外,该架构在复杂推理与数学问题求解方面表现出卓越能力,成功解决了MATH数据集中所有随机选取的问题。在多目标优化领域,基于Nexus的系统成功应对了VTR基准套件中多个设计的复杂时序收敛挑战,平均实现接近30%的功耗降低,充分验证了其在实际工程场景中的有效性与实用性。