2ヶ月前

反復交互型ニューラル注意機構を用いた機械読解

Alessandro Sordoni; Philip Bachman; Adam Trischler; Yoshua Bengio
反復交互型ニューラル注意機構を用いた機械読解
要約

私たちは、文書に対するクローズ形式の質問応答などの機械読解タスクを解決するために、新しい神経注意アーキテクチャを提案します。従来のモデルとは異なり、クエリを単一のベクトルに圧縮せず、代わりに反復的な交互注意メカニズムを採用することで、クエリと文書の両方を詳細に探索することが可能となります。当モデルは、CNNニュース記事や「Children's Book Test (CBT)」データセットなど、標準的な機械読解ベンチマークにおいて最先端の基準モデルを上回る性能を示しています。

反復交互型ニューラル注意機構を用いた機械読解 | 最新論文 | HyperAI超神経