16일 전

증강된 자연어 간의 번역으로서의 구조화 예측

Giovanni Paolini, Ben Athiwaratkun, Jason Krone, Jie Ma, Alessandro Achille, Rishita Anubhai, Cicero Nogueira dos Santos, Bing Xiang, Stefano Soatto
증강된 자연어 간의 번역으로서의 구조화 예측
초록

우리는 구조화된 예측 언어 과제, 즉 공동 엔티티 및 관계 추출, 중첩된 명명된 실체 인식, 관계 분류, 의미 역할 레이블링, 이벤트 추출, 공통 참조 해결, 대화 상태 추적 등 다양한 과제를 해결하기 위해 새로운 프레임워크인 증강 자연어 간 번역(Translation between Augmented Natural Languages, TANL)을 제안한다. 이 방법은 과제별 특화된 판별형 분류기들을 학습하는 방식이 아니라, 과제에 관련된 정보를 쉽게 추출할 수 있는 증강 자연어 간 번역 문제로 문제를 재정의한다. 제안한 접근법은 모든 과제에서 과제별 특화 모델과 경쟁하거나 이를 능가하며, 특히 공동 엔티티 및 관계 추출(CoNLL04, ADE, NYT, ACE2005 데이터셋), 관계 분류(FewRel 및 TACRED), 의미 역할 레이블링(CoNLL-2005 및 CoNLL-2012)에서 새로운 최고 성능(SOTA)을 달성한다. 이러한 성과를 동일한 아키텍처와 하이퍼파라미터를 모든 과제에 일관되게 적용함으로써, 심지어 하나의 모델로 동시에 모든 과제를 해결하는 다중 과제 학습(multi-task learning) 환경에서도 달성하였다. 마지막으로, 레이블 의미 정보를 보다 효과적으로 활용함으로써 본 프레임워크가 저자원 환경에서도 성능을 크게 향상시킬 수 있음을 보여주었다.

증강된 자연어 간의 번역으로서의 구조화 예측 | 최신 연구 논문 | HyperAI초신경