17日前

R2-D2:オープンドメイン質問応答のためのモジュールベースライン

Martin Fajcik, Martin Docekal, Karel Ondrej, Pavel Smrz
R2-D2:オープンドメイン質問応答のためのモジュールベースライン
要約

本研究は、新たな四段階型オープンドメインQAパイプライン「R2-D2(Rank twice, reaD twice)」を提案する。このパイプラインは、リトリーバー、パッセージ再ランカー、抽出型リーダー、生成型リーダー、およびシステム全体の各コンポーネントから得られる予測を統合する機構から構成されている。我々は、NaturalQuestions、TriviaQA、EfficientQAの3つのオープンドメインQAデータセット上でその有効性を実証し、特に最初の2つのデータセットにおいて、既存の最先端手法を上回ることを示した。分析の結果、以下の知見が得られた:(i) 抽出型リーダーと生成型リーダーを組み合わせることで、正確一致(exact match)スコアが最大5ポイント向上し、同じモデル構造だが異なるパラメータを持つものによる事後平均アンサンブル(posterior averaging ensemble)よりも少なくとも2倍以上の効果を発揮することが明らかになった。(ii) パラメータ数が少ない抽出型リーダーでも、抽出型QAデータセットにおいて生成型リーダーと同等の性能を達成できることが確認された。

R2-D2:オープンドメイン質問応答のためのモジュールベースライン | 最新論文 | HyperAI超神経