
要約
本稿では、スパースな語彙表現を活用することにより、細粒度な全語種意味あいまいさ解消(fine-grained all-words word sense disambiguation)のタスクにおいて、より複雑なタスク特化型モデルを上回る性能を達成できることを示す。本研究で提案するアルゴリズムは、過完備な意味的基底ベクトル集合に依拠しており、これによりスパースな文脈依存型語彙表現を獲得することが可能となる。また、情報理論の観点から着想を得た、語義の共起性と語形の非ゼロ成分に基づくシンセット表現を導入し、5つの標準的な意味あいまいさ解消ベンチマークデータセットを統合した設定において、総合Fスコア78.8を達成した。さらに、4つの異なるツリーバンクを用いた品詞タグ付けタスクにおいても、本提案フレームワークの汎用性を実証した。その結果、密度型語彙表現の適用と比較して顕著な性能向上が確認された。