HyperAIHyperAI

Command Palette

Search for a command to run...

動的共注意ネットワークを用いた質問応答

Caiming Xiong Victor Zhong Richard Socher

概要

いくつかの深層学習モデルが質問応答のために提案されています。しかし、それらが一回限りの処理を行うため、誤った答えに対応する局所最大値から復帰する方法はありません。この問題を解決するために、質問応答用の動的共注意ネットワーク(Dynamic Coattention Network: DCN)を導入します。DCNはまず、質問と文書の相互依存表現を融合し、両方に関連する部分に焦点を当てるために設計されています。その後、動的なポインティングデコーダーが潜在的な回答範囲を反復処理します。この反復プロセスにより、モデルは初期の局所最大値(誤った答えに対応するもの)から復帰することが可能になります。スタンフォード大学の質問応答データセットにおいて、単一のDCNモデルはF1スコアを71.0%から75.9%へと改善し、DCNアンサンブルでは80.4%のF1スコアを達成しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
動的共注意ネットワークを用いた質問応答 | 記事 | HyperAI超神経