1ヶ月前

双方向LSTM-CRFモデルによるシーケンスタギング

Zhiheng Huang; Wei Xu; Kai Yu
双方向LSTM-CRFモデルによるシーケンスタギング
要約

本論文では、シーケンスタギングに用いるLong Short-Term Memory (LSTM) ベースのモデルの多様なバリエーションを提案します。これらのモデルには、LSTMネットワーク、双方向LSTM (BI-LSTM) ネットワーク、条件付き確率場 (Conditional Random Field: CRF) 層を備えたLSTM (LSTM-CRF) および双方向LSTMにCRF層を組み合わせたモデル (BI-LSTM-CRF) が含まれます。当研究は初めて双方向LSTMとCRFを組み合わせたモデル(BI-LSTM-CRFと表記)を自然言語処理 (NLP) のベンチマークシーケンスタギングデータセットに適用したものです。我々は、双方向LSTM成分により過去と未来の入力特徴量を効率的に利用できること、またCRF層により文章レベルのタグ情報を利用できることが示されています。BI-LSTM-CRFモデルは品詞タグ付け (POS)、チャンキング、固有表現認識 (NER) のデータセットにおいて最先端(またはそれに近い)の精度を達成できます。さらに、このモデルは堅牢であり、単語埋め込みへの依存度が従来の観察結果よりも低いことも確認されました。

双方向LSTM-CRFモデルによるシーケンスタギング | 最新論文 | HyperAI超神経