
要約
従来の意味誘導(Word Sense Induction: WSI)手法は、通常、各インスタンスを離散的な言語特徴量や共起特徴量で表現し、それぞれの多義語に対して個別にモデルを学習します。本研究では、WSIタスクのために意味埋め込み(sense embeddings)を学習する方法を提案します。学習段階では、当手法は各多義語に対して複数の意味中心点(センサーオイディー)を誘導します。テスト段階では、当手法は各インスタンスを文脈ベクトルとして表現し、埋め込み空間において最も近い意味中心点を見つけることでその意味を誘導します。当手法の利点は以下の通りです。(1) 分散表現の意味ベクトルが差別的に学習され、知識表現として使用されるため、伝統的な頻度ベースの分布モデルよりも優れた性能を持つことが一般的であり、(2) 全語彙に対する一般的なモデルがマルチタスク学習フレームワークのもとで共同して学習され、意味中心点を誘導します。SemEval-2010 WSIデータセットでの評価結果によると、当手法は全ての参加者および最近の多くの最先端手法を上回りました。さらに、慎重に設計された基準モデルとの比較により、これらの2つの利点を検証しています。