17日前

Chain-of-Skills:オープンドメイン質問応答のための設定可能なモデル

Kaixin Ma, Hao Cheng, Yu Zhang, Xiaodong Liu, Eric Nyberg, Jianfeng Gao
Chain-of-Skills:オープンドメイン質問応答のための設定可能なモデル
要約

検索モデルは、オープンドメイン質問応答(ODQA)など、現実世界における知識集約型タスクにおいて不可欠な要素である。これまでの研究では、異なるデータセットに対して個別に検索スキルがアノテーションされてきたため、カスタマイズされた手法に注目が集まっており、モデルの転移可能性およびスケーラビリティに制約が生じていた。本研究では、個々のモジュールが異なるデータセット間で再利用可能な主要なスキルに対応するモジュール型検索モデルを提案する。本アプローチは、ターゲットドメインに応じた柔軟なスキル構成を可能とし、性能の向上を実現する。また、タスク間干渉を軽減するため、スパースTransformerに着想を得た新たなモジュール化パラメータ化手法を設計した。実験により、本モデルがWikipedia上で自己教師付き事前学習を行い、複数のODQAデータセットをマルチタスク形式で微調整することで、性能向上を達成できることを示した。本手法は、ゼロショット評価において最近の自己教師付き検索モデルを上回り、NQ、HotpotQA、OTT-QAにおいて、微調整済み検索性能で最先端の結果を達成した。