مجموعة بيانات QAngaroo لمهارات فهم القراءة والاستدلال متعدد الخطوات
التاريخ
الحجم
رابط النشر
الفئات
مجموعة بيانات QAngaroo هي مجموعة بيانات لفهم القراءة أنشأتها كلية لندن الجامعية (UCL) في عام 2018 والتي تركز على التفكير متعدد القفزات.إنشاء مجموعات بيانات لفهم القراءة متعددة القفزات عبر المستنداتتتكون مجموعة البيانات هذه من جزأين: WikiHop وMedHop، والتي تهدف إلى بناء طريقة فهم القراءة التي يمكنها إجراء استدلال متعدد القفزات، أي أن الحقائق المنتشرة في مستندات مختلفة تتطلب خطوات متعددة من الاستدلال لاستخلاص حقائق جديدة.
WikiHop عبارة عن مجموعة بيانات مفتوحة النطاق تركز على مقالات ويكيبيديا، وتحتوي على 43,738 عينة في مجموعة التدريب و5,129 عينة في مجموعة التحقق.

MedHop عبارة عن مجموعة بيانات تعتمد على ملخصات أوراق PubMed، والتي تحتوي على 1620 عينة في مجموعة التدريب و342 عينة في مجموعة التحقق.

تحتوي كل عينة على استعلام، وحقائق داعمة، وإجابات مرشحة، والإجابة الصحيحة، ومعرف فريد. توفر مجموعات البيانات هذه للباحثين موارد التدريب والتقييم لتطوير نماذج فهم القراءة القادرة على التعامل مع مهام التفكير المعقدة.