2ヶ月前
DR-BiLSTM: 依存関係を考慮した双方向LSTMによる自然言語推論
Reza Ghaeini; Sadid A. Hasan; Vivek Datla; Joey Liu; Kathy Lee; Ashequl Qadir; Yuan Ling; Aaditya Prakash; Xiaoli Z. Fern; Oladimeji Farri

要約
自然言語推論(NLI)タスクを解決するための新しい深層学習アーキテクチャを提案します。既存の手法は、前提と仮説を独立して符号化するための単純な読み取り機構に大きく依存しています。これに対して、我々は前提と仮説の関係を符号化および推論時に効率的にモデル化する新しい従属読み取り双方向LSTMネットワーク(DR-BiLSTM)を提案します。さらに、我々が提案したモデルを組み合わせるための洗練されたアンサンブル戦略も導入し、これが最終的な予測結果を著しく向上させることを示します。最後に、追加の前処理ステップによって結果がさらに改善される方法についても説明します。評価では、DR-BiLSTMが単一モデルおよびアンサンブルモデルにおいて最良の結果を得ており、スタンフォードNLIデータセットで新たな最先端スコアを達成していることが確認されました。