13일 전
제로샷 정보 추출: 텍스트를 삼중항으로 변환하는 통합적 접근
Chenguang Wang, Xiao Liu, Zui Chen, Haoyun Hong, Jie Tang, Dawn Song

초록
우리는 정보 추출 작업군을 텍스트에서 삼중항으로의 번역 프레임워크로 변환하였다. 각 작업을 전용 데이터셋과 모델에 의존하여 해결하는 대신, 작업 전용 입력 텍스트와 출력 삼중항 간의 번역으로 작업을 형식화하였다. 작업 전용 입력을 활용함으로써, 사전 훈련된 언어 모델이 작업에 대해 내재하고 있는 지식을 활용하여 작업에 독립적인 번역을 가능하게 하였다. 또한, 입력 텍스트와 어떤 관계 정보가 대응하는지를 예측하는 단순한 사전 훈련 작업이 작업 전용 출력을 효과적으로 생성할 수 있음을 입증하였다. 이를 통해 본 프레임워크가 하류 작업으로의 제로샷 전이를 가능하게 하였다. 우리는 본 프레임워크의 제로샷 성능을 개방형 정보 추출(OIE2016, NYT, WEB, PENN), 관계 분류(FewRel 및 TACRED), 그리고 사실성 탐지(Google-RE 및 T-REx) 작업에서 평가하였다. 모델은 대부분의 작업으로 비현저한 성능 전이를 보였으며, 어떠한 작업 전용 훈련 없이도 완전히 지도된 방법과 경쟁 가능한 성능을 달성하였다. 예를 들어, 지도 학습 기반의 개방형 정보 추출 모델의 훈련 세트를 사용하지 않고도 그 F1 점수를 크게 상회하였다.