
要約
本研究では、知識ベースのエンティティを使用してテキスト分類を行うニューラルネットワークモデルであるNeural Attentive Bag-of-Entities(神経注意エンティティ袋)モデルを提案します。エンティティは、テキスト内の意味を捉えるために有益な曖昧さのない関連性のある意味情報を提供します。我々は、文書中のエンティティを検出するための辞書に基づく単純な高リコールのエンティティ検出と、モデルが少数の曖昧さのない関連性のあるエンティティに焦点を当てる新しい神経注意メカニズムを組み合わせました。我々は、2つの標準的なテキスト分類データセット(すなわち20 NewsgroupsデータセットとR8データセット)およびトリビアクイズゲームに基づいた一般的な事実質問応答データセットを使用して、提案モデルの有効性を検証しました。その結果、提案モデルはすべてのデータセットで最先端の成果を達成しました。提案モデルのソースコードはオンラインで公開されており、https://github.com/wikipedia2vec/wikipedia2vec からアクセスできます。