
要約
現在、単語の意味解釈(Word Sense Disambiguation: WSD)において、教師ありシステムが標準的なアプローチとなっており、その中心的要素としてTransformerベースの言語モデルが広く用いられている。しかし、これらのシステムは確かに前例のない性能を達成しているものの、ほぼすべてが「文脈が与えられたとき、各単語は他の単語の意味選択を考慮せずに独立して解釈可能である」という制約された仮定の下で動作している。この制約を克服し、その仮定を放棄するために、本研究では「連続的意味理解(CONtinuous SEnse Comprehension: ConSeC)」という新しいWSDアプローチを提案する。近年のWSDタスクの再定式化である「テキスト抽出問題」としてのアプローチを活用し、それを本研究の定式化に適合させるとともに、近接する単語に明示的に割り当てられた意味を考慮することで、ターゲット単語の意味解釈を条件づけるフィードバックループ戦略を導入した。ConSeCの性能を評価し、その各構成要素がどのように既存のすべての手法を上回り、英語WSDにおいて新たな最先端(state-of-the-art)を達成するかを検証した。さらに、リソースの豊富さが異なる8言語を対象とした多言語設定におけるConSeCの性能も検討し、従来の手法に比べて顕著な性能向上を報告した。本研究のコードは、https://github.com/SapienzaNLP/consec にて公開している。