16일 전

AMR 구문 분석을 위한 그래프 세그멘테이션 및 어라이어먼트의 미분 가능한 리ラ크스레이션

Chunchuan Lyu, Shay B. Cohen, Ivan Titov
AMR 구문 분석을 위한 그래프 세그멘테이션 및 어라이어먼트의 미분 가능한 리ラ크스레이션
초록

추상 의미 표현(AMR)은 문장 의미를 방향성 있는 비순환 그래프로 표현하는 광범위한 커버리지의 의미 체계이다. 대부분의 AMR 파서를 훈련시키기 위해서는 그래프를 부분 그래프로 분할하고, 각 부분 그래프를 문장 내 단어와 일치시켜야 한다. 이는 일반적으로 사전 처리 단계에서 수작업 규칙에 의존하여 수행된다. 반면, 본 연구에서는 분할과 일치를 모델 내 잠재 변수로 취급하여, 엔드투엔드 훈련의 일환으로 이를 유도한다.구조적 잠재 변수에 대한 마진화는 계산적으로 불가능하므로, 변분 오토인코더(Variational Autoencoding) 프레임워크를 사용한다. 엔드투엔드 미분 가능한 최적화를 보장하기 위해, 분할 및 일치 문제에 대한 미분 가능한 근사화를 도입한다. 실험 결과, 탐색적 분할 전략을 사용하는 것보다 잠재 분할을 유도하는 것이 상당한 성능 향상을 가져옴을 관찰하였다. 또한 본 방법의 성능은 \citet{lyu-titov-2018-amr}가 개별 AMR 구성 요소를 다루기 위해 수작업으로 설계한 분할 규칙에 의존하는 모델의 성능에 근접함을 확인하였다.

AMR 구문 분석을 위한 그래프 세그멘테이션 및 어라이어먼트의 미분 가능한 리ラ크스레이션 | 최신 연구 논문 | HyperAI초신경