2ヶ月前
aNMM: 注意に基づくニューラルマッチングモデルを用いた短い回答文のランキング
Liu Yang; Qingyao Ai; Jiafeng Guo; W. Bruce Croft

要約
特徴量エンジニアリングに基づく質問応答手法の代替として、最近、深層学習アプローチである畳み込みニューラルネットワーク(CNNs)や長短期記憶モデル(LSTMs)が意味的な質問と回答のマッチングに提案されています。しかし、良好な結果を得るためには、これらのモデルを単語の重複率やBM25スコアなどの追加の特徴量と組み合わせることが必要です。この組み合わせがなければ、これらのモデルは言語学的な特徴量エンジニアリングに基づく手法よりも著しく劣った性能を示します。本論文では、短い回答テキストのランキングに用いる注意メカニズムベースのニューラルマッチングモデル(aNMM)を提案します。異なるマッチング信号を結合するために位置共有加重方式ではなく値共有加重方式を採用し、質問注意ネットワークを使用して質問項の重要度学習を行います。人気のあるベンチマークTREC QAデータセットを使用して、比較的単純なaNMMモデルが質問応答タスクで使用されてきた他のニューラルネットワークモデルよりも著しく優れた性能を示すことを示し、追加の特徴量と組み合わされたモデルと競争力があることを示しています。aNMMが追加の特徴量と組み合わされると、すべての基準モデルを上回ります。