17일 전
HySPA: 확장 가능한 텍스트에서 그래프 추출을 위한 하이브리드 스팬 생성
Liliang Ren, Chenkai Sun, Heng Ji, Julia Hockenmaier

초록
텍스트에서 그래프 추출은 자연어 텍스트에서 언급 및 유형으로 구성된 정보 그래프를 자동으로 추출하는 것을 목표로 한다. 기존의 접근 방식인 테이블 채우기와 쌍별 점수 산정 등은 다양한 정보 추출 작업에서 뛰어난 성능을 보여주었지만, 입력 길이에 대해 이차 복잡도를 가지는 공간 및 시간 복잡도로 인해 긴 입력 텍스트를 가진 데이터셋에 확장하기 어렵다는 한계가 있다. 본 연구에서는 정보 그래프를 노드와 간선 유형이 교차하는 시퀀스로 역으로 매핑할 수 있는 하이브리드 스팬 생성기(HySPA)를 제안한다. 이는 스팬과 유형을 선형 시간 및 공간 복잡도로 반복적으로 디코딩할 수 있는 하이브리드 스팬 디코더를 통해 직접 해당 시퀀스를 생성한다. ACE05 데이터셋에서 실시한 광범위한 실험 결과, 본 방법은 종합적인 엔터티 및 관계 추출 작업에서 최신 기술을 크게 능가함을 입증하였다.