2 个月前

用于编程语言修正的深度强化学习

Rahul Gupta; Aditya Kanade; Shirish Shevade
用于编程语言修正的深度强化学习
摘要

初学者程序员常常在编程语言的形式语法上遇到困难。为了帮助他们,我们设计了一种新颖的编程语言修正框架,该框架适用于强化学习。此框架允许智能体模仿人类在文本导航和编辑方面的操作。我们证明了智能体可以通过自我探索直接从原始输入(即程序文本本身)进行训练,而无需了解编程语言的形式语法。我们利用专家演示作为训练数据的十分之一来加速训练过程。所提出的技术在6975个包含拼写错误的C语言程序上进行了评估,这些程序是由参加入门级编程课程的学生编写的。我们的技术相对于最先进的工具DeepFix(使用完全监督的神经机器翻译方法)而言,能够修复更多14%的程序和更多29%的编译器错误信息。

用于编程语言修正的深度强化学习 | 最新论文 | HyperAI超神经