18일 전
텍스트 내 명명된 엔티티의 강건한 모호성 해소
{Gerhard Weikum, Stefan Thater, Bilyana Taneva, Marc Spaniol, Manfred Pinkal, Hagen Fürstenau, Ilaria Bordino, Mohamed Amir Yosef, Johannes Hoffart}

초록
자연어 텍스트 내의 명칭 엔티티를 명확히 하기 위한 작업은 DBpedia나 YAGO와 같은 지식 기반에 등록된 사람, 장소 등의 표준 엔티티에 대해 모호한 이름 언급을 매핑하는 과정이다. 본 논문은 지식 기반의 맥락 정보를 활용하고 새로운 형태의 일관성 그래프(coherence graph)를 도입함으로써 집단적 명칭 해석(collective disambiguation)을 위한 강력한 방법을 제안한다. 이 방법은 기존의 접근 방식들을 통합한 포괄적인 프레임워크를 제시하며, 세 가지 측정 기준을 결합한다. 첫째, 엔티티가 언급될 가능성에 대한 사전 확률, 둘째, 언급과 후보 엔티티 간의 맥락 유사도, 셋째, 모든 언급에 대해 후보 엔티티들 사이의 일관성이다. 제안된 방법은 언급과 후보 엔티티들 간의 가중치 그래프를 구축하고, 최적의 공동 언급-엔티티 매핑을 근사하는 밀도 높은 부분 그래프를 계산한다. 실험 결과, 제안한 방법은 정확도 측면에서 기존 방법들을 상회하며, 다양한 입력에 대해 안정적인 성능을 보임을 확인하였다.