テーブルおよびテキスト上のオープンな質問応答

オープンQA(質問応答)では、質問に対する回答を、関連する可能性のある文書を検索した後、その文書を分析することによって生成する。従来のオープンQAシステムは、主に非構造化テキストからの情報検索に焦点を当てていた。本研究では、初めて表形式データとテキストデータの両方を対象としたオープンQAに取り組み、このタスクの性能評価を目的として、大規模な新データセット「Open Table-and-Text Question Answering(OTT-QA)」を提示する。OTT-QAに含まれる大多数の質問は、表形式データと非構造化テキストの間で複数ステップの推論(multi-hop inference)を必要とする。また、質問に答えるために必要な証拠は、これらの2種類の入力データにさまざまな形で分散しているため、証拠の検索が困難である。本研究で提案するベースラインモデル(イテレーティブな検索器とBERTベースのリーダーを組み合わせたもの)では、正確一致スコア(exact match score)が10%未満にとどまる。そこで、OTT-QAにおける証拠の検索と統合の課題に対処するため、2つの新規技術を提案する。1つ目の技術は、「イアリー・フェュージョン(early fusion)」を用いて、複数の関連性の高い表形式データとテキスト単位を統合したブロックとしてグループ化することにより、検索器がより豊かな文脈を用いて探索できるようにするものである。2つ目の技術は、複数の検索された証拠間の相関関係を、グローバル・ローカル疎注意力(global-local sparse attention)を用いたクロスブロックリーダーでモデル化するものである。これらの2つの技術を組み合わせることで、性能が著しく向上し、スコアは27%以上にまで改善された。