HyperAIHyperAI

Command Palette

Search for a command to run...

干预者:通过交互修复链提升大型语言模型的编码能力

Hanbin Wang Zhenghao Liu* Shuo Wang Ganqu Cui Ning Ding Zhiyuan Liu Ge Yu

摘要

本文介绍了INTERVENOR(交互式代码修复链),一个旨在模拟人类观察到的交互式代码修复过程的系统,涵盖了代码诊断和代码修复两个方面。INTERVENOR促使大型语言模型(LLMs)在代码修复过程中扮演不同的角色,既作为代码学习者,也作为代码教师。具体而言,代码学习者的任务是遵循指令生成或修复代码,而代码教师则负责制定一条修复链(Chain-of-Repair, CoR),以指导代码学习者。在生成CoR的过程中,代码教师需要检查来自代码学习者的生成代码,并根据编译器返回的错误反馈重新评估如何解决代码中的错误。实验结果表明,INTERVENOR超越了基线模型,在代码生成任务中比GPT-3.5提高了约18%,在代码翻译任务中提高了约4.3%。进一步分析显示,CoR能够有效地揭示错误背后的原因,并用自然语言概述解决方案计划。借助编译器的反馈,INTERVENOR可以准确识别语法错误和断言错误,并提供精确的修复指令。所有数据和代码均可在https://github.com/NEUIR/INTERVENOR 获取。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
干预者:通过交互修复链提升大型语言模型的编码能力 | 论文 | HyperAI超神经