RussianSuperGLUE: معيار تقييم فهم اللغة الروسية

في هذا البحث، نقدم معيارًا متقدمًا لتقييم فهم اللغة الروسية العامة -- RussianGLUE. تتطلب التطورات الحديثة في مجال النماذج اللغوية الشاملة والمتغيرات (transformers) تطوير منهجية لتشخيصها واختبارها بشكل شامل للقدرات العقلية العامة - اكتشاف الاستدلال اللغوي الطبيعي، المنطق العام، القدرة على أداء العمليات المنطقية البسيطة بغض النظر عن موضوع النص أو المفردات. ولأول مرة، تم تطوير معيار يتألف من تسعة مهام جُمعت ونظّمت بطريقة مشابهة لمنهجية SuperGLUE من الصفر للغة الروسية. نوفر خطوط الأساس، وتقييمًا على مستوى البشر، وإطارًا مفتوح المصدر لتقييم النماذج (https://github.com/RussianNLP/RussianSuperGLUE)، وجدول تصنيف عام للنماذج المتغيرة للغة الروسية. بالإضافة إلى ذلك، نقدم أولى النتائج للمقارنة بين النماذج متعددة اللغات في مجموعة الاختبار التشخيصي المعدلة ونسعى لأولى الخطوات نحو توسيع أو تقييم النماذج الرائدة بشكل مستقل عن اللغة.