2달 전
InstructUIE: 다중 작업 지시어 조정을 위한 통합 정보 추출
Xiao Wang; Weikang Zhou; Can Zu; Han Xia; Tianze Chen; Yuansen Zhang; Rui Zheng; Junjie Ye; Qi Zhang; Tao Gui; Jihua Kang; Jingsheng Yang; Siyuan Li; Chunsai Du

초록
대형 언어 모델은 지시문을 읽음으로써 강력한 다중 작업 능력을 해금하였습니다. 그러나 최근 연구에서는 기존의 대형 모델들이 정보 추출 작업에서 여전히 어려움을 겪고 있음을 보여주었습니다. 예를 들어, gpt-3.5-turbo는 Ontonotes 데이터셋에서 F1 점수 18.22를 달성하였는데, 이는 최신 기술 수준보다 크게 낮습니다. 본 논문에서는 지시 조정을 기반으로 하는 통합 정보 추출 프레임워크인 InstructUIE를 제안합니다. 이 프레임워크는 다양한 정보 추출 작업을 일관되게 모델링하고 작업 간 의존성을 포착할 수 있습니다. 제안된 방법의 유효성을 검증하기 위해, 우리는 전문가가 작성한 지시문과 함께 32개의 다양한 정보 추출 데이터셋으로 구성된 통합 텍스트-텍스트 형식의 벤치마크인 IE INSTRUCTIONS를 소개합니다. 실험 결과, 제안된 방법이 감독 학습 환경에서는 Bert와 유사한 성능을 보였으며, 제로샷 설정에서는 최신 기술 수준과 gpt3.5를 크게 앞섰음을 입증하였습니다.