2ヶ月前

LSTMを用いた監督および半監督テキスト分類における地域埋め込み

Rie Johnson; Tong Zhang
LSTMを用いた監督および半監督テキスト分類における地域埋め込み
要約

ワンホットCNN(畳み込みニューラルネットワーク)は、テキスト分類に有効であることが示されています(Johnson & Zhang, 2015)。私たちはこれを、線形モデルと非線形特徴生成器(`テキスト領域埋め込み + プーリング')を組み合わせて共同で学習する一般的なフレームワークの特別なケースとして捉えています。このフレームワークのもとで、私たちはLong Short-Term Memory (LSTM) を使用したより洗練された領域埋め込み手法を探求します。LSTMは可変(かつおそらく大きな)サイズのテキスト領域を埋め込むことができますが、CNNでは領域のサイズが固定される必要があります。私たちは監督学習および半教師付き学習の設定において、LSTMをこの目的に効果的かつ効率的に使用することを目指しています。最良の結果は、ラベルなしデータで学習したLSTMと畳み込み層の領域埋め込みを組み合わせることによって得られました。これらの結果は、単独の単語の埋め込みよりも、複雑な概念を伝えることができるテキスト領域の埋め込みの方がこのタスクにおいて有用であることを示唆しています。私たちは4つのベンチマークデータセットにおいて、これまでの最高結果を超える性能を報告します。

LSTMを用いた監督および半監督テキスト分類における地域埋め込み | 最新論文 | HyperAI超神経