11일 전
AMR 구문 분석을 위한 그래프 예측의 앙상블
Hoang Thanh Lam, Gabriele Picco, Yufang Hou, Young-Suk Lee, Lam M. Nguyen, Dzung T. Phan, Vanessa López, Ramon Fernandez Astudillo

초록
다수의 기계학습 작업에서 모델은 그래프와 같은 구조 데이터를 예측하도록 훈련된다. 예를 들어 자연어 처리 분야에서는 텍스트를 의존성 트리 또는 추상 의미 표현(AMR, Abstract Meaning Representation) 그래프로 분석하는 것이 매우 흔하다. 한편, 앙상블(ensemble) 기법은 여러 모델의 예측을 결합하여 개별 예측보다 더 강력하고 정확한 새로운 모델을 생성하는 방법이다. 기존 문헌에서는 분류나 회귀 문제에 대한 다양한 앙상블 기법이 제안되었지만, 그래프 예측을 위한 앙상블 기법은 아직 충분히 연구되지 않았다. 본 연구에서는 이 문제를 '다수의 그래프 예측에 의해 가장 잘 지지되는 최대 그래프를 탐색하는 문제'로 공식화한다. 이 문제는 NP-완전(NP-Hard)이므로, 최적해를 근사하기 위한 효율적인 휴리스틱 알고리즘을 제안한다. 제안된 접근법의 타당성을 검증하기 위해 AMR 구문 분석 문제에서 실험을 수행하였다. 실험 결과, 제안한 방법은 최신 AMR 파서들의 강점을 결합하여, 다섯 개의 표준 벤치마크 데이터셋에서 개별 모델보다 더 정확한 새로운 예측을 생성할 수 있음을 입증하였다.