
要約
初心のプログラマは、プログラミング言語の形式的な構文にしばしば苦労します。これを支援するために、強化学習に適した新しいプログラミング言語訂正フレームワークを設計しました。このフレームワークでは、エージェントがテキストのナビゲーションと編集における人間の行動を模倣することができます。私たちは、エージェントがプログラミング言語の形式的な構文に関する知識なしで、プログラムテキスト自体から直接自己探査を通じて学習できることを示しました。訓練データの10分の1に相当する専門家のデモンストレーションを利用することで、訓練を加速しています。提案された技術は、入門プログラミングコースで学生が書いた6975個のタイポグラフィックエラーを含む誤ったCプログラムに対して評価されました。当技術は、最先端ツールであるDeepFix(完全監督型ニューラル機械翻訳アプローチを使用)が修正したプログラムとコンパイラエラーメッセージよりも、14%多くプログラムを修正し、29%多くコンパイラエラーメッセージを修正することができました。