11일 전

맥락 기반 스팬 표현을 활용한 엔티티, 관계 및 이벤트 추출

David Wadden, Ulme Wennberg, Yi Luan, Hannaneh Hajishirzi
맥락 기반 스팬 표현을 활용한 엔티티, 관계 및 이벤트 추출
초록

우리는 명칭(entity) 인식, 관계 추출, 이벤트 추출이라는 세 가지 정보 추출 작업을 위한 통합적이고 다중 작업 기반의 프레임워크의 능력을 검토한다. 본 연구에서 제안하는 프레임워크(DyGIE++)는 문장 내(local) 및 문장 간(global) 맥락을 포착할 수 있도록 설계된 텍스트 스팬(span)을 열거하고, 이를 정제하며, 점수를 매기는 방식으로 모든 작업을 수행한다. 제안된 프레임워크는 다양한 도메인에서 나온 네 가지 데이터셋에서 모든 작업에서 최고 성능을 기록하며, 기존의 최선의 방법들을 초월하는 결과를 보였다. 우리는 스팬 표현을 구성하기 위한 다양한 기법들을 비교하는 실험을 수행하였다. BERT와 같은 컨텍스트 기반 임베딩은 동일하거나 인접한 문장 내의 엔티티 간의 관계를 효과적으로 포착하지만, 동적 스팬 그래프 업데이트 기법은 장거리 문장 간 관계를 모델링하는 데 유리하다. 예를 들어, 예측된 공명 참조 연결을 통해 스팬 표현을 전파하면 모델이 어려운 엔티티 언급을 정확히 해석하는 데 도움이 된다. 본 연구의 코드는 https://github.com/dwadden/dygiepp 에 공개되어 있으며, 새로운 작업이나 데이터셋에 쉽게 적용 가능하다.

맥락 기반 스팬 표현을 활용한 엔티티, 관계 및 이벤트 추출 | 최신 연구 논문 | HyperAI초신경