مجموعة بيانات اللغة الإشارية الروسية

إحدى التحديات الرئيسية في مهمة تمييز لغة الإشارة تكمن في صعوبة جمع مجموعة بيانات مناسبة نظرًا للفراغ بين المجتمعات الصماء والسمعية. بالإضافة إلى ذلك، تختلف لغة الإشارة في كل دولة بشكل كبير، مما يفرض الحاجة إلى إنشاء بيانات جديدة لكل دولة على حدة. تقدم هذه الورقة مجموعة بيانات فيديو لغة الإشارة الروسية (RSL) بعنوان "سلوو"، تم إنتاجها باستخدام منصات جمع البيانات الجماعية. تحتوي المجموعة على 20,000 تسجيلًا بجودة FullHD، موزعة على 1,000 فئة من إشارات RSL المعزولة، التي تم إرسالها من قبل 194 مُشِرِّرًا. كما نقدّم أيضًا كامل عملية إنشاء المجموعة، بدءًا من جمع البيانات وحتى تسمية الفيديوهات، مع تطبيق تجريبي مصاحب. تم تدريب وتجريب عدة شبكات عصبية على مجموعة "سلوو" لإظهار قدرتها التعليمية. وتُتاح البيانات المقترحة والنماذج المُدرَّبة مسبقًا للجمهور بشكل عام.