17日前
読む前に生成せよ!機械読解を用いた忠実な長文質問応答
Dan Su, Xiaoguang Li, Jindi Zhang, Lifeng Shang, Xin Jiang, Qun Liu, Pascale Fung

要約
長文質問応答(Long-form Question Answering, LFQA)は、与えられた質問に対して段落レベルの回答を生成することを目的としています。現在、大規模な事前学習モデルを活用したLFQAに関する研究は、流暢である程度関連性のあるコンテンツを効果的に生成できるものの、その一方で、幻覚(hallucination)を伴わない忠実な回答を生成する方法という点で主な課題が残っています。本研究では、回答生成と機械読解を統合的にモデル化する新たなエンド・ツー・エンドフレームワークを提案します。このアプローチの核心は、生成モデルに、回答に関連する詳細な顕著な情報を追加することにあり、これは忠実な事実に焦点を当てるという意味合いを持ちます。ELI5およびMS MARCOの2つのLFQAデータセットにおいて、最先端の結果が得られ、自動評価および人間評価の両面で強力なベースラインと比較して本手法の有効性が実証されました。さらに詳細な分析により、本手法が流暢で関連性が高く、かつより忠実な回答を生成する能力を有していることが裏付けられました。