16일 전

HLT@SUDA at SemEval-2019 Task 1: UCCA 그래프 구문 분석을 구성 트리 구문 분석로 접근하기

{Wei Jiang, Zhenghua Li, Min Zhang, Yu Zhang}
HLT@SUDA at SemEval-2019 Task 1: UCCA 그래프 구문 분석을 구성 트리 구문 분석로 접근하기
초록

이 논문은 UCCA 의미 그래프 구문 분석을 위한 간단한 접근법을 제시한다. 핵심 아이디어는 UCCA 의미 그래프를 구성 요소 트리로 변환하는 것으로, 향후 복원을 위해 원거리 간선과 비연속 노드를 명시적으로 표시하기 위해 추가 레이블을 설계하는 것이다. 이를 통해 기존의 구문 분석 기술을 활용할 수 있다. 데이터 통계를 바탕으로 구성 요소 분석기의 출력 레이블을 직접 활용하여 비연속 노드를 복원하고, 더 복잡한 원거리 간선의 복원을 위해 이중선형 분류 모델을 사용한다. 분류 모델과 구성 요소 분석기는 다중 작업 학습(Multi-task Learning) 프레임워크 하에서 동시에 학습된다. 오픈 트랙에서는 다국어 BERT를 추가 특징으로 활용한다. 본 시스템은 참가한 일곱 개 시스템 중 영어/독일어 폐쇄형 및 개방형 트랙 6개에서 1위를 차지하였다. 제7의 다국어 트랙에서는 프랑스어에 대한 학습 데이터가 극히 적은 상황에서, 영어와 독일어의 학습 데이터를 활용하기 위한 언어 임베딩 방식을 제안하였으며, 이에 따른 성능은 2위를 기록하였다.

HLT@SUDA at SemEval-2019 Task 1: UCCA 그래프 구문 분석을 구성 트리 구문 분석로 접근하기 | 최신 연구 논문 | HyperAI초신경