17일 전

맥락화된 표현을 통한 개선된 테이블 채우기를 이용한 명명된 엔티티 인식 및 관계 추출

Youmi Ma, Tatsuya Hiraoka, Naoaki Okazaki
맥락화된 표현을 통한 개선된 테이블 채우기를 이용한 명명된 엔티티 인식 및 관계 추출
초록

본 연구에서는 테이블 표현 기반의 비구조화 텍스트로부터 명명된 실체 및 관계를 추출하는 새로운 방법을 제안한다. 제안된 방법은 문맥 기반 단어 임베딩을 활용하여, 복잡한 수작업 특징 또는 신경망 아키텍처 없이 실체 언급 및 장거리 종속성을 표현한다. 또한, 이전 상태 기반 예측이나 탐색 전략에 의존하지 않고, 텐서 도트 곱을 활용하여 관계 레이블을 한 번에 예측한다. 이러한 개선은 실체 및 관계 추출을 위한 모델과 알고리즘을 크게 단순화한다. 단순함에도 불구하고 실험 결과는 제안된 방법이 CoNLL04 및 ACE05 영어 데이터셋에서 최신 기술(SOTA) 방법들을 능가함을 보여준다. 또한, 여러 문장을 제공하여 문맥을 통합할 경우, 제안된 방법이 ACE05 데이터셋에서 최신 기술 수준의 NER 모델과 유사한 성능을 달성함을 확인하였다.