2달 전
다중 헤드 선택 문제로서의 공동 실체 인식 및 관계 추출
Giannis Bekoulis; Johannes Deleu; Thomas Demeester; Chris Develder

초록
최신의 공통 실체 인식 및 관계 추출 모델은 POS (품사 태깅) 태거와 의존성 분석기 등의 외부 자연어 처리(NLP) 도구에 강하게 의존합니다. 따라서 이러한 공통 모델의 성능은 이러한 NLP 도구에서 얻은 특징들의 품질에 크게 좌우됩니다. 그러나 이러한 특징들은 다양한 언어와 맥락에서 항상 정확하지는 않습니다. 본 논문에서는 수동으로 추출된 특징이나 외부 도구를 사용하지 않고, 실체 인식과 관계 추출을 동시에 수행하는 공통 신경망 모델을 제안합니다. 구체적으로, 실체 인식 작업은 CRF (조건부 랜덤 필드) 계층을 사용하여 모델링하고, 관계 추출 작업은 다중 헤드 선택 문제(즉, 각 실체에 대해 여러 관계를 잠재적으로 식별하는 문제)로 모델링합니다. 우리는 다양한 맥락(즉, 뉴스, 생물의학, 부동산)과 언어(즉, 영어, 네덜란드어)의 데이터셋을 사용하여 본 방법의 효과성을 입증하기 위한 광범위한 실험 설계를 제시합니다. 우리의 모델은 자동으로 추출된 특징을 사용하는 이전 신경망 모델보다 우수한 성능을 보이며, 특징 기반 신경망 모델과 비교해도 합리적인 범위 내에서 유사하거나 심지어 그들을 능가하는 성능을 보입니다.