11일 전
OpenUE: 텍스트에서의 유니버설 추출을 위한 오픈 툴킷
{Huajun Chen, Wei zhang, Fei Huang, Mosha Chen, Jiacheng Yang, Haiyang Yu, Zhen Bi, Shumin Deng, Ningyu Zhang}

초록
자연어 처리는 토큰 수준 또는 문장 수준의 이해를 포함하는 다양한 작업을 포함한다. 본 논문에서는 대부분의 작업이 단일한 유니버설 추출 형식으로 표현될 수 있다는 간단한 통찰을 제시한다. 우리는 프로토타입 모델을 소개하고, 다양한 추출 작업을 위한 오픈소스이자 확장 가능한 툴킷인 OpenUE를 제공한다. OpenUE는 개발자가 텍스트에서 정보를 추출하기 위한 사용자 정의 모델을 훈련할 수 있도록 하며, 연구자들이 모델을 신속하게 검증할 수 있도록 지원한다. 또한 OpenUE는 충분한 모듈성과 확장성을 유지하기 위해 다양한 기능 모듈을 제공한다. 툴킷 외에도, 학습 및 배포 없이 실시간 추출을 지원하기 위해 RESTful API를 갖춘 온라인 데모를 구축하였다. 더불어, 온라인 시스템은 관계 삼중항 추출, 슬롯 및 의도 탐지, 이벤트 추출 등 다양한 작업에서 정보를 추출할 수 있다. 소스 코드, 데이터셋, 사전 훈련된 모델을 http://github.com/zjunlp/openue에서 공개하여 향후 연구를 촉진하고자 한다.