3ヶ月前

Natural Questions：質問応答研究のためのベンチマーク

{Jakob Uszkoreit Andrew M. Dai Ming-Wei Chang Chris Alberti Tom Kwiatkowski Slav Petrov Michael Collins Matthew Kelcey Llion Jones Jennimaria Palomaki

要約

本稿では、質問応答（QA）を目的とした「Natural Questionsコーパス」を紹介する。このコーパスに含まれる質問は、Google検索エンジンに実際に投げられた匿名化・集約されたクエリから構成されている。アノテーターは、検索結果上位5件内の1つのWikipediaページとともに質問を提示され、そのページに存在する長文回答（通常は段落）と短文回答（1つ以上のエンティティ）をアノテートする。ただし、該当する長文・短文回答が存在しない場合は「null」とマークする。公開リリース版は、単一アノテーション付きの307,373件の訓練データ、5重アノテーション付きの7,830件の開発データ、およびさらに5重アノテーション付きの7,842件のテストデータ（隔離済み）から構成されている。本研究では、データの品質を検証する実験を報告する。また、302件のサンプルに対して25重アノテーションを実施した分析を通じて、アノテーションタスクにおける人間の変動性に関する洞察を提示する。さらに、質問応答システムの評価を目的とした堅牢な評価指標を導入し、これらの指標における人間の上限性能を示すとともに、関連分野の先行研究から得られた競争的アプローチを用いてベースライン結果を確立した。

ベンチマーク

ベンチマーク	方法論	指標
question-answering-on-natural-questions-long	DecAtt + DocReader	F1: 54.8

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング

すぐに使える GPU

最適価格

今すぐ始める

Hyper Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

Natural Questions：質問応答研究のためのベンチマーク

{Jakob Uszkoreit Andrew M. Dai Ming-Wei Chang Chris Alberti Tom Kwiatkowski Slav Petrov Michael Collins Matthew Kelcey Llion Jones Jennimaria Palomaki8 more

要約

ベンチマーク

AI で AI を構築

Hyper Newsletters

{Jakob Uszkoreit Andrew M. Dai Ming-Wei Chang Chris Alberti Tom Kwiatkowski Slav Petrov Michael Collins Matthew Kelcey Llion Jones Jennimaria Palomaki