
초록
초보 프로그래머들은 종종 프로그래밍 언어의 형식적인 구문에 어려움을 겪습니다. 이를 돕기 위해 강화학습에 적합한 새로운 프로그래밍 언어 교정 프레임워크를 설계하였습니다. 이 프레임워크는 에이전트가 텍스트 탐색 및 편집을 위한 인간의 행동을 모방할 수 있도록 합니다. 우리는 에이전트가 프로그래밍 언어의 형식적 구문에 대한 어떠한 지식도 없이, 즉 원시 입력인 프로그램 텍스트 자체에서 직접 자가 탐색을 통해 학습될 수 있음을 보여주었습니다. 우리는 전문가의 시연 데이터를 전체 학습 데이터의 10분의 1로 활용하여 학습 속도를 높였습니다. 제안된 기술은 초급 프로그래밍 과정에서 학생들이 작성한 6975개의 오타가 포함된 C 프로그램에서 평가되었습니다. 우리의 기술은 최신 도구인 DeepFix(완전히 감독된 신경 기계 번역 접근 방식을 사용)보다 14% 더 많은 프로그램과 29% 더 많은 컴파일러 오류 메시지를 수정하였습니다.