Natural Questions: معيار لبحث الإجابة على الأسئلة
نقدّم مجموعة بيانات Natural Questions، وهي مجموعة بيانات مخصصة لحل الأسئلة. تتكون الأسئلة من استعلامات حقيقية، مجهّلة، ومجمّعة، تم إرسالها إلى محرك بحث جوجل. يُقدّم مُعدّ التصنيف سؤالًا مع صفحة ويكيبيديا من النتائج الخمسة الأولى في نتائج البحث، ثم يقوم بتوثيق إجابة طويلة (عادةً فقرة واحدة) وإجابة قصيرة (كائنة واحدة أو أكثر من الكيانات) إن وُجدت على الصفحة، أو يُعلّم "غير موجود" إذا لم تكن هناك إجابة طويلة أو قصيرة. تتضمن النسخة العامة من المجموعة 307,373 مثالًا تدريبيًا مع تسمية واحدة، و7,830 مثالًا مُسَمّى بخمس طرق لبيانات التطوير، و7,842 مثالًا إضافيًا مُسَمّى بخمس طرق وتم حجبه كبيانات اختبار. نقدّم تجارب تُحقق من جودة البيانات. كما نُقدّم تحليلًا لـ 25 تسمية مُتعددة على 302 مثالًا، مما يُقدّم رؤى حول التباين البشري في مهمة التصنيف. نُقدّم مقاييس متينة لغرض تقييم أنظمة حل الأسئلة؛ ونُظهِر حدودًا عالية للإنسان على هذه المقاييس؛ ونُثبّت نتائج أساسية باستخدام أساليب تنافسية مستمدة من الأدبيات ذات الصلة.