2 个月前

干预者:通过交互修复链提升大型语言模型的编码能力

Wang, Hanbin ; Liu, Zhenghao ; Wang, Shuo ; Cui, Ganqu ; Ding, Ning ; Liu, Zhiyuan ; Yu, Ge
干预者:通过交互修复链提升大型语言模型的编码能力
摘要

本文介绍了INTERVENOR(交互式代码修复链),一个旨在模拟人类观察到的交互式代码修复过程的系统,涵盖了代码诊断和代码修复两个方面。INTERVENOR促使大型语言模型(LLMs)在代码修复过程中扮演不同的角色,既作为代码学习者,也作为代码教师。具体而言,代码学习者的任务是遵循指令生成或修复代码,而代码教师则负责制定一条修复链(Chain-of-Repair, CoR),以指导代码学习者。在生成CoR的过程中,代码教师需要检查来自代码学习者的生成代码,并根据编译器返回的错误反馈重新评估如何解决代码中的错误。实验结果表明,INTERVENOR超越了基线模型,在代码生成任务中比GPT-3.5提高了约18%,在代码翻译任务中提高了约4.3%。进一步分析显示,CoR能够有效地揭示错误背后的原因,并用自然语言概述解决方案计划。借助编译器的反馈,INTERVENOR可以准确识别语法错误和断言错误,并提供精确的修复指令。所有数据和代码均可在https://github.com/NEUIR/INTERVENOR 获取。

干预者:通过交互修复链提升大型语言模型的编码能力 | 最新论文 | HyperAI超神经