HyperAIHyperAI
منذ 17 أيام

SCDE: مجموعة بيانات تكميل الجملة ذات مُضلِّلات عالية الجودة المستمدة من الامتحانات

Xiang Kong, Varun Gangal, Eduard Hovy
SCDE: مجموعة بيانات تكميل الجملة ذات مُضلِّلات عالية الجودة المستمدة من الامتحانات
الملخص

نقدّم SCDE، وهو مجموعة بيانات لتقييم أداء النماذج الحاسوبية من خلال توقع الجمل. تُعدّ SCDE مجموعة بيانات مُعدّة يدويًا لاختبار جملة مفقودة (Sentence Cloze)، جُمعت من امتحانات اللغة الإنجليزية المدرسية العامة. يتطلب هذا التمرين من النموذج ملء عدة فراغات في نصّ معين من مجموعة مرشّحات مشتركة، تتضمّن عناصر تشويش تم تصميمها من قبل مدرسي اللغة الإنجليزية. تُظهر النتائج التجريبية أن هذا التمرين يتطلب استخدام سياق غير محلي ومستوى تواصلي (Discourse-level) يتجاوز الجملة المجاورة مباشرة. كما أن الفراغات تتطلب حلًا مشتركًا، وتشوّش سياق بعضها البعض بشكل كبير. علاوةً على ذلك، من خلال التحليل التجريبي (ablations)، نُظهر أن عناصر التشويش عالية الجودة، وتجعل التمرين أكثر صعوبة. تُظهر تجاربنا وجود فجوة كبيرة في الأداء بين النماذج المتقدمة (72%) والبشر (87%)، مما يشجّع على تطوير نماذج مستقبلية لتقليل هذه الفجوة.