16일 전
AMR 구문 분석을 위한 그래프 세그멘테이션 및 어라이어먼트의 미분 가능한 리ラ크스레이션
Chunchuan Lyu, Shay B. Cohen, Ivan Titov

초록
추상 의미 표현(AMR)은 문장 의미를 방향성 있는 비순환 그래프로 표현하는 광범위한 커버리지의 의미 체계이다. 대부분의 AMR 파서를 훈련시키기 위해서는 그래프를 부분 그래프로 분할하고, 각 부분 그래프를 문장 내 단어와 일치시켜야 한다. 이는 일반적으로 사전 처리 단계에서 수작업 규칙에 의존하여 수행된다. 반면, 본 연구에서는 분할과 일치를 모델 내 잠재 변수로 취급하여, 엔드투엔드 훈련의 일환으로 이를 유도한다.구조적 잠재 변수에 대한 마진화는 계산적으로 불가능하므로, 변분 오토인코더(Variational Autoencoding) 프레임워크를 사용한다. 엔드투엔드 미분 가능한 최적화를 보장하기 위해, 분할 및 일치 문제에 대한 미분 가능한 근사화를 도입한다. 실험 결과, 탐색적 분할 전략을 사용하는 것보다 잠재 분할을 유도하는 것이 상당한 성능 향상을 가져옴을 관찰하였다. 또한 본 방법의 성능은 \citet{lyu-titov-2018-amr}가 개별 AMR 구성 요소를 다루기 위해 수작업으로 설계한 분할 규칙에 의존하는 모델의 성능에 근접함을 확인하였다.