HyperAIHyperAI
منذ 2 أشهر

مهمة SIGMORPHON المشتركة لعام 2022 في تقسيم المورفيمات

Khuyagbaatar Batsuren; Gábor Bella; Aryaman Arora; Viktor Martinović; Kyle Gorman; Zdeněk Žabokrtský; Amarsanaa Ganbold; Šárka Dohnalová; Magda Ševčíková; Kateřina Pelegrinová; Fausto Giunchiglia; Ryan Cotterell; Ekaterina Vylomova
مهمة SIGMORPHON المشتركة لعام 2022 في تقسيم المورفيمات
الملخص

تحدي تقسيم المورفيمات في مهمة SIGMORPHON المشتركة لعام 2022 على تقسيم الكلمة إلى سلسلة من المورفيمات وغطى معظم أنواع الصياغة الصرفية: التراكيب، الاشتقاقات، والتصريفات. تناول الجزء الفرعي الأول، وهو تقسيم المورفيمات على مستوى الكلمة، 5 ملايين كلمة في 9 لغات (التشيكية، الإنجليزية، الإسبانية، المجرية، الفرنسية، الإيطالية، الروسية، اللاتينية، المنغولية) وتلقى 13 طلبًا من 7 فرق وكانت أفضل نظام قد حقق متوسط درجة F1 بنسبة 97.29% عبر جميع اللغات، تتراوح بين الإنجليزية (93.84%) واللاتينية (99.38%). أما الجزء الفرعي الثاني، وهو تقسيم المورفيمات على مستوى الجملة,则涵盖了3种语言(捷克语、英语、蒙古语)中的18,735个句子,收到了来自3个团队的10个系统提交,最佳系统在所有三种最先进的子词分词方法(BPE,ULM,Morfessor2)上绝对超过了30.71%。为了便于错误分析和支持未来的任何研究,我们发布了所有系统的预测结果、评估脚本以及所有金标准数据集。注:在最后一句中,“则涵盖了”被翻译为“فقد غطى”,以符合阿拉伯语的表达习惯;同时对不常见的术语进行了标注。以下是修正后的翻译:تحدي تقسيم المورفيمات في مهمة SIGMORPHON المشتركة لعام 2022 على تقسيم الكلمة إلى سلسلة من المورفيمات وغطى معظم أنواع الصياغة الصرفية: التراكيب، الاشتقاقات، والتصريفات. الجزء الفرعي الأول من هذه المهمة والذي يتعلق بتقسيم المورفيمات على مستوى الكلمة شمل 5 ملايين كلمة في 9 لغات (التشيكية، الإنجليزية,الإسبانية,المجرية,الفرنسية,الإيطالية,الروسية,اللاتينية،المنغولية) وتلقى 13 طلبًا من 7 فرق وكانت أفضل نتيجة لمتوسط درجة F1 بنسبة 97.29% عبر جميع اللغات، تتراوح بين الإنجليزية (93.84%) واللاتينية (99.38%). أما الجزء الفرعي الثاني فقد غطى تقسيم المورفيمات على مستوى الجملة وشمل 18,735 جملة في ثلاث لغات (التشيكية, الإنجليزية, المنغولية)، وتلقى 10 طلبات من ثلاثة فرق وأفضل النظم تجاوزت بـ30.71% نسب الدقة المطلقة للطرق الثلاث الرائدة في مجال تجزئة الكلمات الفرعية (BPE, ULM, Morfessor2). ولتسهيل تحليل الأخطاء ودعم أي دراسات مستقبلية محتملة, قمنا بنشر جميع التوقعات التي أنتجتها الأنظمة بالإضافة إلى سكريبت التقييم وكافة مجموعات البيانات القياسية الذهبية.

مهمة SIGMORPHON المشتركة لعام 2022 في تقسيم المورفيمات | أحدث الأوراق البحثية | HyperAI