HyperAI

摘要

本文介绍了INTERVENOR（交互式代码修复链），一个旨在模拟人类观察到的交互式代码修复过程的系统，涵盖了代码诊断和代码修复两个方面。INTERVENOR促使大型语言模型（LLMs）在代码修复过程中扮演不同的角色，既作为代码学习者，也作为代码教师。具体而言，代码学习者的任务是遵循指令生成或修复代码，而代码教师则负责制定一条修复链（Chain-of-Repair, CoR），以指导代码学习者。在生成CoR的过程中，代码教师需要检查来自代码学习者的生成代码，并根据编译器返回的错误反馈重新评估如何解决代码中的错误。实验结果表明，INTERVENOR超越了基线模型，在代码生成任务中比GPT-3.5提高了约18%，在代码翻译任务中提高了约4.3%。进一步分析显示，CoR能够有效地揭示错误背后的原因，并用自然语言概述解决方案计划。借助编译器的反馈，INTERVENOR可以准确识别语法错误和断言错误，并提供精确的修复指令。所有数据和代码均可在https://github.com/NEUIR/INTERVENOR 获取。

摘要

Hanbin Wang Zhenghao Liu* Shuo Wang Ganqu Cui Ning Ding Zhiyuan Liu Ge Yu

摘要

用 AI 构建 AI

HyperAI Newsletters

Hanbin Wang Zhenghao Liu* Shuo Wang Ganqu Cui Ning Ding Zhiyuan Liu Ge Yu

摘要

用 AI 构建 AI

HyperAI Newsletters

Hanbin Wang Zhenghao Liu* Shuo Wang Ganqu Cui Ning Ding Zhiyuan Liu Ge Yu

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

干预者：通过交互修复链提升大型语言模型的编码能力

Hanbin Wang Zhenghao Liu* Shuo Wang Ganqu Cui Ning Ding Zhiyuan Liu Ge Yu

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

干预者：通过交互修复链提升大型语言模型的编码能力

Hanbin Wang Zhenghao Liu* Shuo Wang Ganqu Cui Ning Ding Zhiyuan Liu Ge Yu

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

干预者：通过交互修复链提升大型语言模型的编码能力

Hanbin Wang Zhenghao Liu* Shuo Wang Ganqu Cui Ning Ding Zhiyuan Liu Ge Yu

摘要

用 AI 构建 AI

HyperAI Newsletters