1 个月前

LongCodeZip：为Code LLM压缩长上下文

Yuling Shi Yichun Qian Hongyu Zhang Beijun Shen Xiaodong Gu

摘要

随着大型语言模型（LLMs）需要在代码库中处理大量信息以进行推理，长上下文下的代码生成正变得日益关键。尽管近期进展使代码类LLM能够处理长输入，但高昂的API成本和生成延迟仍是显著瓶颈。现有上下文剪枝技术（如LLMLingua）在通用文本任务中取得了良好效果，却忽视了代码特有的结构与依赖关系，导致在编程任务中表现欠佳。本文提出LongCodeZip，一种专为代码LLM设计的新型即插即用式代码压缩框架。LongCodeZip采用双阶段策略：（1）粗粒度压缩，基于指令条件困惑度识别并排序函数级代码块，仅保留最相关函数；（2）细粒度压缩，根据困惑度将保留的函数进一步划分为代码块，并在自适应的token预算下选择最优子集，以最大化内容相关性。在代码补全、摘要生成和问答等多个任务上的评估表明，LongCodeZip持续优于基线方法，在不降低任务性能的前提下，实现最高达5.6倍的压缩比。通过有效缩减上下文规模同时保留关键信息，LongCodeZip显著提升了LLM在真实世界大规模代码场景中的可扩展性，推动了代码智能应用在效率与能力上的进步。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

LongCodeZip：为Code LLM压缩长上下文

Yuling Shi Yichun Qian Hongyu Zhang Beijun Shen Xiaodong Gu

摘要

用 AI 构建 AI

Hyper Newsletters