2ヶ月前

CNN/Daily Mail 読解タスクの詳細な検討

Danqi Chen; Jason Bolton; Christopher D. Manning
CNN/Daily Mail 読解タスクの詳細な検討
要約

コンピュータが文書を理解し、その理解度に関する質問に答えることを可能にするのは、自然言語処理(NLP)の中心的な目標であり、未解決の課題です。機械学習システムがこの問題を解くのに阻害されている主因は、人間によって注釈されたデータの限られた入手可能性です。Hermannら(2015)は、この問題を解決するために、CNNとDaily Mailのニュース記事とそれらの要約された箇条書きをペアにして100万以上の訓練例を作成し、ニューラルネットワークがこのタスクで優れた性能を発揮するように訓練できることを示しました。本論文では、この新しい読解タスクについて詳細な検討を行います。我々の主要な目的は、このタスクにおいて良好な成績を得るためにはどの程度の言語理解が必要であるかを把握することです。一方では小さな部分集合の問題に対する慎重な手動分析を行い、他方では単純ながら慎重に設計されたシステムがこれらの2つのデータセットで73.6%および76.6%の精度を得られることを示すことでアプローチします。これは現在の最先端結果を超える7-10%高い精度であり、我々が考えるこのタスクにおける性能上限に近づいています。

CNN/Daily Mail 読解タスクの詳細な検討 | 最新論文 | HyperAI超神経