18日前
テキストにおける名前付きエンティティのロバストな曖昧性解消
{Gerhard Weikum, Stefan Thater, Bilyana Taneva, Marc Spaniol, Manfred Pinkal, Hagen Fürstenau, Ilaria Bordino, Mohamed Amir Yosef, Johannes Hoffart}

要約
自然言語テキストにおける固有表現の曖昧性解消は、DBpediaやYAGOなどの知識ベースに登録された人物や場所などの標準的エンティティに、曖昧な名前の出現を対応付けるプロセスである。本稿では、知識ベースからの文脈情報を活用し、新たな整合性グラフ(coherence graph)を導入することで、集団的(collective)な曖昧性解消を実現する堅牢な手法を提案する。この手法は、従来のアプローチを統合した包括的なフレームワークを構築し、以下の3つの指標を組み合わせている:(1)エンティティが出現する事前確率、(2)出現表現と候補エンティティとの文脈の類似度、および(3)すべての出現に対して共に考慮される候補エンティティ間の整合性。本手法は、出現と候補エンティティの間に重み付きグラフを構築し、最適な同時出現-エンティティマッピングを近似する高密度部分グラフを計算する。実験の結果、本手法は精度において従来手法を顕著に上回り、さまざまな入力に対して安定した性能を示した。