Command Palette
Search for a command to run...

摘要
我们定义“智能体性”(Agency)为人工智能系统作为自主智能体所涌现出的能力,即能够主动发现任务、提出假设,并通过与环境及工具的自主交互来执行解决方案。这一基础能力标志着“人工智能智能体时代”的开启,其背后驱动着一场关键的产业变革:社会迫切需要的不仅是能够思考的AI系统,更是能够真正“工作”的AI系统。尽管当前AI在推理与响应生成方面表现出色,但产业界更亟需具备自主执行任务、操作工具并推动现实成果的智能体。随着智能体智能逐渐成为区分认知系统与生产力工具的核心特征,高效培育机器自主性已成为当务之急。现有方法普遍假设:更多数据必然带来更强的智能体能力,这一理念遵循传统语言建模中的规模扩展规律。我们对此提出根本性挑战。LIMI(“少即是多”于智能体性)证明,智能体性的演进遵循截然不同的发展规律。通过聚焦协作式软件开发与科学研究工作流等关键场景,我们发现:仅需少量但经过战略性筛选的自主行为示范,即可催生出高度复杂的智能体智能。在仅使用78个精心设计的训练样本的情况下,LIMI在综合性智能体能力基准测试中取得了73.5%的得分,显著超越当前最先进模型:Kimi-K2-Instruct(24.1%)、DeepSeek-V3.1(11.9%)、Qwen3-235B-A22B-Instruct(27.5%)以及GLM-4.5(45.1%)。尤为突出的是,LIMI在仅用128分之一样本量(即相比10,000样本训练模型)的情况下,仍实现了53.7%的性能提升,展现出更优的智能体智能。我们的研究确立了“智能体效率原则”:机器自主性并非源于数据的海量堆积,而在于对高质量智能体示范行为的精准、战略性筛选。