
초록
AMR-to-text 생성은 추상 의미 표현(AMR) 그래프에서 문장을 생성하는 것을 목표로 하는 최근에 자연어 처리(NLP) 커뮤니티에 소개된 문제입니다. 시퀀스-투-시퀀스 모델을 사용하여 AMR 그래프를 문자열로 변환함으로써 이 문제를 해결할 수 있습니다. 그래프와 직접 작업하면서 접근하는 경우, 그래프-투-시퀀스 모델을 사용하여 AMR 그래프를 벡터 표현으로 인코딩해야 합니다. 과거 연구에서는 이러한 인코딩이 유용하다는 것이 입증되었으며, 순차적 인코딩과 달리 AMR 그래프의 재진입 구조(reentrant structures)를 명시적으로 포착할 수 있습니다. 우리는 재진입 노드(다중 부모 노드)가 AMR-to-text 생성에 미치는 영향의 정도를 조사하기 위해 그래프 인코더와 트리 인코더(재진입 구조가 보존되지 않음)를 비교하였습니다. 결과적으로, 재진입 구조와 장거리 의존 관계(long-range dependencies) 처리의 개선이 그래프 인코더의 전반적인 점수 향상에 기여한다는 것을 확인하였습니다. 우리의 최고 모델은 LDC2015E86 데이터셋에서 24.40 BLEU 점수를 달성하여 기존 최신 연구보다 1.1점 높았으며, LDC2017T10 데이터셋에서는 24.54 BLEU 점수를 기록하여 기존 최신 연구보다 1.24점 높았습니다.