
초록
신경망 방법은 의미 해석 분야에서 최근 몇 가지 성공을 거두었지만, 아직 형식적 의미론에 기반한 의미 표현 생성의 도전을 받아들인 적이 없습니다. 본 연구에서는 영어 문장에 대해 높은 정확도로 디스코스 표현 구조(Discourse Representation Structures, DRSs)를 생성할 수 있는 시퀀스-투-시퀀스 신경망 의미 해석기(sequence-to-sequence neural semantic parser)를 제시합니다. 이 모델은 전통적인 DRS 해석기를 능가하며, 출력 학습을 용이하게 하기 위해 DRSs를 평면 절(clauses)의 시퀀스로 표현하고, 생성된 DRSs가 올바르고 해석 가능하다는 것을 확인하기 위한 방법을 소개합니다. 문자(characters)와 단어(words)를 입력으로 사용하는 모델들을 비교한 결과, 다소 놀랍게도 전자가 후자보다 더 우수한 성능을 보임을 확인하였습니다. 출력에서 변수 이름을 제거하고 드 브루이진 인덱스(De Bruijn-indices)를 사용함으로써 해석기의 성능이 향상됨을 보였습니다. 은색 훈련 데이터(silver training data)를 추가하면 성능 향상 효과가 더욱 커집니다.