17日前

ADAPT at SemEval-2018 Task 9: 専門コーパスにおける教師なしハイパニム発見のためのSkip-Gram単語埋め込み

{Filip Klubi{\v{c}}ka, Alfredo Maldonado}
ADAPT at SemEval-2018 Task 9: 専門コーパスにおける教師なしハイパニム発見のためのSkip-Gram単語埋め込み
要約

本稿では、上位語(ハイパニム)発見に向けたシンプルでありながら競争力のある教師なしシステムを提案する。このシステムは、専門的なコーパス上で学習されたネガティブサンプリングを用いたスキップグラム単語埋め込み(word embeddings)を活用し、入力語の候補上位語をコサイン類似度スコアに基づいて予測する。2つの専門コーパス—医療分野コーパスと音楽産業コーパス—それぞれについて、独立して単語埋め込みモデルを訓練した。評価結果によると、医療分野においては他の教師なしシステムと比較して最高のスコアを記録したが、音楽産業分野では性能が低かった。本システムは、生の専門コーパス以外に外部データを一切必要としない。