2달 전

신경망을 활용한 언어 간 실체 연결(Neural Cross-Lingual Entity Linking)

Avirup Sil; Gourab Kundu; Radu Florian; Wael Hamza
신경망을 활용한 언어 간 실체 연결(Neural Cross-Lingual Entity Linking)
초록

엔티티 링킹(EL)에서 주요 과제 중 하나는 상황에 따라 다른 엔티티를 가리킬 수 있는 위키피디아 언급을 명확히 구분하기 위해 문맥 정보를 효과적으로 활용하는 것입니다. 이 문제는 비영어 문서의 언급을 영어 위키피디아 항목과 연결하는 다국어 EL에서 더욱 심각해집니다. 여러 언어 간의 텍스트 단편을 비교하기 위해서는 언어 간 유사성을 계산해야 합니다. 본 논문에서는 쿼리와 후보 문서 사이의 미세한 유사성과 차이점을 여러 관점에서 합성곱과 텐서 네트워크를 통해 학습하는 신경망 EL 모델을 제안합니다. 또한, 이 영어로 학습된 시스템이 다국어 임베딩을 놀랍게도 효과적으로 활용하여 제로샷 학습으로 다른 언어에도 적용될 수 있음을 보여줍니다. 제안된 시스템은 영어뿐만 아니라 스페인어와 중국어 TAC 2015 데이터셋에서도 최고의 결과를 나타내는 강력한 경험적 증거를 제공합니다.