
要約
単語意味解釈(Word Sense Disambiguation: WSD)は、特定の文脈における曖昧な単語の正確な意味を特定することを目指しています。従来の監督学習手法では、WordNetなどの言葉のリソースがほとんど考慮されていませんが、これらのリソースは知識ベースの手法で広く利用されています。最近の研究では、ニューラルネットワークに意味定義(gloss)を組み込むことの有効性が示されています。しかし、伝統的な単語専門家による監督学習手法と比較すると、大きな改善は見られていません。本論文では、監督型ニューラルWSDシステムにおいて意味定義をより効果的に活用する方法に焦点を当てます。我々は文脈-意味定義ペアを作成し、3つのBERTベースモデルを提案します。事前学習されたBERTモデルをSemCor3.0トレーニングコーパスで微調整し、いくつかの英語全単語WSDベンチマークデータセットでの実験結果から、我々の手法が最先端のシステムを上回ることが示されました。