إعادة النظر في تبسيط النصوص غير الإنجليزية: معيار متعدد اللغات موحد

أدى التقدم الأخير في الموارد الإنجليزية عالية الجودة والمتعددة الأحجام إلى دفع حدود بحوث التبسيط التلقائي للنصوص الإنجليزية (ATS). ومع ذلك، فإن العمل المبذول في مجال تبسيط النصوص متعددة اللغات يظل محدودًا نظرًا لغياب معيار تقييم متنوع يغطي أزواج الجمل المعقدة-البسيطة في العديد من اللغات. يقدّم هذا البحث معيار MultiSim، وهو مجموعة من 27 موردًا بلغات مختلفة تبلغ 12 لغة، تحتوي على أكثر من 1.7 مليون زوج من الجمل المعقدة والبسيطة. وسيشجّع هذا المعيار الأبحاث الموجهة إلى تطوير نماذج أكثر فعالية لتفسير النصوص متعددة اللغات، إلى جانب تطوير مقاييس تقييم متطورة. أظهرت تجاربنا باستخدام MultiSim مع نماذج اللغة متعددة اللغات المُدرّبة مسبقًا تحسّنًا ملحوظًا في الأداء الناتج عن التدريب متعدد اللغات في البيئات غير الإنجليزية. ولاحظنا أداءً قويًا للغة الروسية في نقل عابر للغات بدون تدريب (zero-shot) إلى لغات منخفضة الموارد. كما أظهرنا أن التحفيز القائم على عدد قليل من الأمثلة (few-shot prompting) باستخدام نموذج BLOOM-176b يحقق جودة مماثلة لتفسيرات المراجع، وتفوق النماذج المُدرّبة بتفصيل (fine-tuned) في معظم اللغات. وتم التحقق من هذه النتائج من خلال تقييم بشري.