FQuAD: مجموعة بيانات الإجابة عن الأسئلة بالفرنسية

أحدث التقدم في مجال نمذجة اللغة قد عزز النتائج القياسية في العديد من مهام معالجة اللغة الطبيعية. ومن بين هذه المهام، حققت مهارة فهم القراءة تقدماً ملحوظاً خلال السنوات القليلة الماضية. ومع ذلك، تُعلن معظم النتائج باللغة الإنجليزية، نظراً لقلة الموارد المُعلَّمة المتوفرة بلغات أخرى مثل الفرنسية. في هذا العمل، نقدم مجموعة بيانات فرنسية للإجابة على الأسئلة (FQuAD). تُعد FQuAD مجموعة بيانات فرنسية أصيلة لفهم القراءة، تتضمن أسئلة وإجابات مبنية على مجموعة من مقالات ويكيبيديا، وتضم أكثر من 25,000 عينة في الإصدار 1.0، وأكثر من 60,000 عينة في الإصدار 1.1. وقد قمنا بتدريب نموذج أساسي يحقق معدلاً لدقة F1 قدره 92.2، ونسبة مطابقة دقيقة (Exact Match) بلغت 82.1 على مجموعة الاختبار. ولتمكين متابعة التقدم المحرز في نماذج الإجابة على الأسئلة باللغة الفرنسية، قمنا بعرض لوحة تصنيف (Leader-board)، ونُشر الإصدار 1.0 من مجموعة البيانات مجاناً عبر الرابط: https://illuin-tech.github.io/FQuAD-explorer/.