2ヶ月前

動的共注意ネットワークを用いた質問応答

Caiming Xiong; Victor Zhong; Richard Socher
動的共注意ネットワークを用いた質問応答
要約

いくつかの深層学習モデルが質問応答のために提案されています。しかし、それらが一回限りの処理を行うため、誤った答えに対応する局所最大値から復帰する方法はありません。この問題を解決するために、質問応答用の動的共注意ネットワーク(Dynamic Coattention Network: DCN)を導入します。DCNはまず、質問と文書の相互依存表現を融合し、両方に関連する部分に焦点を当てるために設計されています。その後、動的なポインティングデコーダーが潜在的な回答範囲を反復処理します。この反復プロセスにより、モデルは初期の局所最大値(誤った答えに対応するもの)から復帰することが可能になります。スタンフォード大学の質問応答データセットにおいて、単一のDCNモデルはF1スコアを71.0%から75.9%へと改善し、DCNアンサンブルでは80.4%のF1スコアを達成しています。