17日前

教師なしQA向けの質問-回答ペアの収集と精製

Zhongli Li, Wenhui Wang, Li Dong, Furu Wei, Ke Xu
教師なしQA向けの質問-回答ペアの収集と精製
要約

質問応答(QA)は、大規模なデータセットの可用性とニューラルモデルの有効性により、著しい成功を収めてきた。近年の研究では、ラベル付きデータが限られているあるいは存在しない設定においても、この成功を拡張することに取り組んでいる。本研究では、無教師QAの性能向上のための2つのアプローチを提案する。第一に、Wikipediaから語彙的・構文的に多様な質問を収集し、自動的に質問-回答ペアのコーパス(RefQAと命名)を構築する。第二に、QAモデルを活用してより適切な回答を抽出し、RefQA上でのデータを反復的に精緻化する。本手法は、手動でアノテートされたデータにアクセスせずにBERTをファインチューニングすることで、SQuAD 1.1およびNewsQAにおいて実験を実施した。その結果、従来の無教師アプローチを大幅に上回り、初期の教師ありモデルと競合する性能を達成した。さらに、少データ学習(few-shot learning)の設定においても、本手法の有効性を示した。

教師なしQA向けの質問-回答ペアの収集と精製 | 最新論文 | HyperAI超神経