11日前

テキスト分類のための再帰的畳み込みニューラルネットワーク

{Jun Zhao, Kang Liu, Liheng Xu, Siwei Lai}
要約

テキスト分類は、多くの自然言語処理(NLP)アプリケーションにおける基盤的なタスクである。従来のテキスト分類手法は、辞書や知識ベース、特殊なツリー核(tree kernels)など、多数の人間が設計した特徴量に依存していることが多かった。これに対して、本研究では人為的な特徴量を一切用いない再帰的畳み込みニューラルネットワーク(recurrent convolutional neural network)を提案する。本モデルでは、単語表現を学習する際に、文脈情報を可能な限り捉えるために再帰構造を適用しており、従来のウィンドウベースのニューラルネットワークと比べて著しくノイズが少ない。また、テキスト分類において重要な役割を果たす語を自動的に判断するためのマックスプーリング層を導入し、テキスト内の重要な要素を抽出する。本手法は4つの一般的に用いられるデータセット上で実験を行い、その結果、特にドキュメントレベルのデータセットにおいて、既存の最先端手法を上回る性能を示した。

テキスト分類のための再帰的畳み込みニューラルネットワーク | 最新論文 | HyperAI超神経