2달 전

InstructUIE: 다중 작업 지시어 조정을 위한 통합 정보 추출

Xiao Wang; Weikang Zhou; Can Zu; Han Xia; Tianze Chen; Yuansen Zhang; Rui Zheng; Junjie Ye; Qi Zhang; Tao Gui; Jihua Kang; Jingsheng Yang; Siyuan Li; Chunsai Du
InstructUIE: 다중 작업 지시어 조정을 위한 통합 정보 추출
초록

대형 언어 모델은 지시문을 읽음으로써 강력한 다중 작업 능력을 해금하였습니다. 그러나 최근 연구에서는 기존의 대형 모델들이 정보 추출 작업에서 여전히 어려움을 겪고 있음을 보여주었습니다. 예를 들어, gpt-3.5-turbo는 Ontonotes 데이터셋에서 F1 점수 18.22를 달성하였는데, 이는 최신 기술 수준보다 크게 낮습니다. 본 논문에서는 지시 조정을 기반으로 하는 통합 정보 추출 프레임워크인 InstructUIE를 제안합니다. 이 프레임워크는 다양한 정보 추출 작업을 일관되게 모델링하고 작업 간 의존성을 포착할 수 있습니다. 제안된 방법의 유효성을 검증하기 위해, 우리는 전문가가 작성한 지시문과 함께 32개의 다양한 정보 추출 데이터셋으로 구성된 통합 텍스트-텍스트 형식의 벤치마크인 IE INSTRUCTIONS를 소개합니다. 실험 결과, 제안된 방법이 감독 학습 환경에서는 Bert와 유사한 성능을 보였으며, 제로샷 설정에서는 최신 기술 수준과 gpt3.5를 크게 앞섰음을 입증하였습니다.

InstructUIE: 다중 작업 지시어 조정을 위한 통합 정보 추출 | 최신 연구 논문 | HyperAI초신경