
要約
単語の意味あいまいさ解消(Word Sense Disambiguation; WSD)の分野において、ニューラルアーキテクチャは現在の最先端技術である。しかし、これらの手法は、語彙知識ベース(Lexical Knowledge Bases; LKB)に含まれる膨大な関係情報の活用が限られている。本研究では、LKBのグラフ構造から得られる情報をニューラルアーキテクチャに統合し、事前学習済みのシノセット(synset)埋め込みを活用することで、学習データに含まれないシノセットの予測も可能にする、教師ありニューラルアーキテクチャ「Enhanced WSD Integrating Synset Embeddings and Relations(EWISER)」を提案する。その結果、検討されたほぼすべての評価設定において、新たな最先端性能を達成した。特に、標準的なすべての英語WSD評価ベンチマークを連結した際の性能において、初めて80%の壁を突破した。多言語全単語WSDにおいても、英語データのみで学習したにもかかわらず、最先端の結果を報告した。