
要約
単語の意味の中心にある要素を特定し、他の単語と区別するための特徴を同定することは、自然言語推論の基本的なタスクの一つである。本論文では、そのような特徴的属性の同定を支援するための明示的単語ベクトル表現モデル(WVM: Word Vector Model)を提案する。本研究の主な貢献は、説明可能で明示的なWVMの構築において、異なる種類のデータソースおよび知識ベースの定量的・定性的比較分析を実施したことである。具体的には、(i) 辞書定義から構築された知識グラフ、(ii) 画像から抽出されたエンティティ・属性・関係グラフ、(iii) 一般常識知識グラフの3種類を比較検討した。詳細な定量的・定性的分析を通じて、これらのデータソースが互いに補完的な意味的側面を有しており、明示的な意味ベクトル空間の構築を支えることが示された。評価実験では、特徴的属性の同定というタスクを用いて明示的ベクトル空間の性能を検証した結果、最先端システムと同等の性能(F1スコア = 0.69)を達成した一方で、モデルの完全な透明性と説明可能性を実現していることが明らかになった。