HyperAI

초록

텍스트-to-AMR 구문 분석에서 현재 최고 성능을 기록하는 의미론적 파서는 여러 개의 서로 다른 모듈 또는 구성 요소를 통합한 복잡한 파이프라인을 사용하며, 학습 데이터 기반으로 개발된 콘텐츠 특화 히ュ리스틱(그래프 재분류)를 활용한다. 그러나 이러한 그래프 재분류 기법이 분포 외(Out-of-Distribution) 환경에서의 일반화 능력은 명확하지 않다. 반면, 파싱의 역과정으로 볼 수 있는 최신 AMR-to-텍스트 생성은 보다 간단한 seq2seq 기반 아키텍처에 기반하고 있다. 본 논문에서는 텍스트-to-AMR와 AMR-to-텍스트를 대칭적인 변환(Transduction) 문제로 재정의하고, 주의 깊게 설계된 그래프 선형화 방법을 도입하며 사전 학습된 인코더-디코더 모델을 확장함으로써, 동일한 seq2seq 접근 방식을 통해 두 작업 모두에서 최고 수준의 성능을 달성할 수 있음을 보여준다. 이는 SPRING (acl{spring})이라는 모델을 통해 이루어졌다. 본 모델은 복잡한 파이프라인이나 강한 가정에 기반한 히ュ리스틱을 필요로 하지 않으며, 실제로 그래프 재분류의 필요성을 제거함으로써, 이 기법이 표준 벤치마크 외에서는 오히려 해로울 수 있음을 실험적으로 입증한다. 마지막으로, 영어 AMR 2.0 데이터셋에서 기존 최고 성능 모델을 크게 상회하며, 텍스트-to-AMR에서는 Smatch 점수 기준 3.6점의 향상, AMR-to-텍스트에서는 BLEU 점수 기준 11.2점의 우수성을 기록하였다. 관련 소프트웨어는 github.com/SapienzaNLP/spring에서 공개한다.

벤치마크	방법론	지표
amr-parsing-on-bio	SPRING DFS	Smatch: 59.7
amr-parsing-on-bio	SPRING DFS + silver	Smatch: 59.5
amr-parsing-on-ldc2017t10	SPRING	Smatch: 84.3
amr-parsing-on-ldc2020t02	SPRING DFS + silver	Smatch: 83.0
amr-parsing-on-ldc2020t02	SPRING DFS	Smatch: 83.0
amr-parsing-on-new3	SPRING DFS + silver	Smatch: 71.8
amr-parsing-on-new3	SPRING DFS	Smatch: 73.7
amr-parsing-on-the-little-prince	SPRING DFS + silver	Smatch: 77.5
amr-parsing-on-the-little-prince	SPRING DFS	Smatch: 77.3

벤치마크

방법론

지표

amr-parsing-on-bio

SPRING DFS

Smatch: 59.7

amr-parsing-on-bio

SPRING DFS + silver

Smatch: 59.5

amr-parsing-on-ldc2017t10

SPRING

Smatch: 84.3