2달 전
통일된 구조 생성을 통한 보편적 정보 추출
Yaojie Lu; Qing Liu; Dai Dai; Xinyan Xiao; Hongyu Lin; Xianpei Han; Le Sun; Hua Wu

초록
정보 추출은 다양한 대상, 이질적인 구조, 그리고 요구사항에 따른 스키마의 다양성으로 인해 어려움을 겪습니다. 본 논문에서는 이러한 문제를 해결하기 위해 UIE라는 통합된 텍스트-구조 생성 프레임워크를 제안합니다. UIE는 다양한 정보 추출(IE) 작업을 일반적으로 모델링하고, 대상에 맞는 구조를 적응적으로 생성하며, 서로 다른 지식 출처에서 일반적인 IE 능력을 협업적으로 학습할 수 있습니다. 구체적으로, UIE는 구조화된 추출 언어를 통해 다양한 추출 구조를 일관되게 인코딩하고, 스키마 기반 프롬프트 메커니즘인 구조적 스키마 지시자(structural schema instructor)를 통해 대상 추출을 적응적으로 생성하며, 대규모 사전 학습된 텍스트-구조 모델을 통해 공통적인 IE 능력을 포착합니다. 실험 결과, UIE는 4개의 IE 작업, 13개의 데이터셋에서 최고의 성능을 보였으며, 감독학습, 저자원, 소수 샘플 설정에서 다양한 실체(entity), 관계(relation), 사건(event), 감정(sentiment) 추출 작업과 그 통합에 대해 모두 우수한 성능을 발휘했습니다. 이러한 결과들은 UIE의 효과성, 보편성 및 전이성을 검증하였습니다.