معيار GEM: إنشاء اللغة الطبيعية، تقييمها ومقاييسها

نقدم GEM، وهو معيار حي لتقنيات توليد اللغة الطبيعية (NLG) وتقييمها ومقاييسها. يعتمد قياس التقدم في توليد اللغة الطبيعية على نظام بيئي متغير باستمرار يتضمن مقاييس آلية، ومجموعات بيانات، ومعايير تقييم بشرية. نظرًا لهذه الهدف المتحركة، غالبًا ما لا يزال يتم تقييم النماذج الجديدة على مجموعات بيانات ذات مركزية إنجليزية متباعدة باستخدام مقاييس معروفة ولكنها معيبة. هذا الانفصال يجعل من الصعب تحديد حدود النماذج الحالية والفرص المتاحة للتقدم. لمعالجة هذه المشكلة، يوفر GEM بيئة يمكن فيها تطبيق النماذج بسهولة على مجموعة واسعة من المهام واختبار استراتيجيات التقييم. ستساعد التحديثات الدورية للمعيار في جعل أبحاث توليد اللغة الطبيعية أكثر تنوعًا من حيث اللغات وتطور التحدي إلى جانب النماذج. يُعد هذا البحث وصفًا للبيانات التي ننظم حولها مهمة مشتركة في ورشة عملنا ضمن مؤتمر ACL 2021، والتي ندعو إليها المجتمع بأكمله في مجال توليد اللغة الطبيعية للمشاركة.