摘要

大型语言模型（LLM）驱动的智能体展现出卓越的能力，使得复杂、多步骤任务的系统化解决成为可能。然而，其不断攀升的成本正威胁着系统的可扩展性与可及性。本文首次系统性地研究了现代智能体系统中的效率与效果之间的权衡问题，旨在满足在不牺牲性能的前提下实现成本效益设计的关键需求。我们围绕三个核心问题展开探究：（1）智能体任务本身究竟需要多大的复杂性？（2）在何种情况下增加模块会带来边际收益递减？（3）通过高效智能体框架的设计，究竟能实现多大程度的效率提升？基于GAIA基准的实证分析，我们评估了LLM主干模型选择、智能体框架设计以及测试时扩展策略的影响。借助“每轮成本”（cost-of-pass）指标，我们量化了上述各维度之间的效率-性能权衡关系。研究结果推动了“高效智能体”（Efficient Agents）这一新型智能体框架的提出，该框架在任务需求与系统复杂性之间实现了最优平衡。高效智能体在保持与当前领先的开源智能体框架OWL 96.7%性能水平的同时，将运行成本从0.398美元降至0.228美元，使每轮成本降低28.4%。本研究为设计高效、高性能的智能体系统提供了切实可行的洞见，推动了人工智能驱动解决方案的可及性与可持续发展。

源 PDF