
要約
私たちは、文書に対するクローズ形式の質問応答などの機械読解タスクを解決するために、新しい神経注意アーキテクチャを提案します。従来のモデルとは異なり、クエリを単一のベクトルに圧縮せず、代わりに反復的な交互注意メカニズムを採用することで、クエリと文書の両方を詳細に探索することが可能となります。当モデルは、CNNニュース記事や「Children's Book Test (CBT)」データセットなど、標準的な機械読解ベンチマークにおいて最先端の基準モデルを上回る性能を示しています。
私たちは、文書に対するクローズ形式の質問応答などの機械読解タスクを解決するために、新しい神経注意アーキテクチャを提案します。従来のモデルとは異なり、クエリを単一のベクトルに圧縮せず、代わりに反復的な交互注意メカニズムを採用することで、クエリと文書の両方を詳細に探索することが可能となります。当モデルは、CNNニュース記事や「Children's Book Test (CBT)」データセットなど、標準的な機械読解ベンチマークにおいて最先端の基準モデルを上回る性能を示しています。