HyperAI

在处理大规模上下文时，大型语言模型（LLM）面临一个核心挑战：随着上下文长度增加，模型性能会显著下降，这种现象被称为“上下文衰减”（context rot）。尽管前沿模型的上下文窗口已扩展至数十万甚至百万级token，但有效处理能力往往远低于理论上限。为突破这一瓶颈，Zhang等人在2025年提出“递归语言模型”（Recursive Language Models, RLM）这一创新方法，通过编程式推理实现对超长上下文的高效处理。 RLM的核心思想是将整个输入视为一个可编程的Python REPL环境，而非一次性传入完整提示。模型不再试图“塞进”全部信息，而是通过编写代码，动态地访问、分解和递归调用自身处理数据片段。例如，在分析近150万字符的多篇文章时，RLM首先解析结构，识别出40篇独立文章，并自动筛选出2025年发布的13篇内容。随后，它分批调用子模型对每篇文章进行语义分析，提取关键趋势，最后整合为完整结论。这一过程展现出极强的智能与结构化能力。模型能自主探索数据、识别模式、分步执行、验证结果，并在每一步中利用llm_query等工具进行深层语义理解，避免了传统摘要方法中信息丢失的问题。实验表明，RLM在GPT-5和Qwen-3等模型上均显著优于传统方法，尤其在长周期、高复杂度任务中表现突出。借助DSPy框架的实现，RLM已可便捷集成。只需指定输入输出签名，系统即可自动管理递归流程。整个过程透明可追溯，通过inspect_history和trajectory可查看每一步的推理与代码执行，极大增强了可解释性。值得注意的是，RLM的成功高度依赖清晰、具体的指令。初始版本因未强调“按年筛选”而遗漏关键信息，但在加入明确提示后，模型迅速修正策略，精准识别2025年文章并输出高质量趋势总结，包括：自主智能体、多智能体协作、动态RAG、标准化协议（MCP/ACP）、工具调用、生产级框架、评估可观测性、编程化开发范式等。总体而言，RLM代表了LLM处理长上下文的新范式——将“塞入信息”转变为“智能分解与递归求解”。它充分利用模型对代码的天然理解能力，实现可扩展、可解释、可验证的推理。未来，随着AI系统处理规模持续扩大，RLM有望成为构建复杂、可靠AI应用的核心基础设施。

相关链接

相关链接

相关链接

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

Command Palette

突破上下文极限：递归语言模型如何重塑AI长文本处理

相关链接

Command Palette

突破上下文极限：递归语言模型如何重塑AI长文本处理

相关链接

Command Palette

突破上下文极限：递归语言模型如何重塑AI长文本处理

相关链接

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新