DeepGRU: أداة التعرف العميق على الإيماءات

نقترح نموذج شبكة عميقة جديدًا يُسمى DeepGRU، وهو مُستند إلى التطورات الحديثة في تعلم العمق للاعتراف بالإيماءات والأفعال، ويعتبر مبسطًا وخاليًا من الارتباط بالأجهزة. يستخدم DeepGRU بيانات الهيكل العظمي الخام أو وضعية الجسم أو البيانات المتجهة فقط، وهو سهل الفهم والتنفيذ والتدريب، ومع ذلك يحقق نتائجًا رائدة على مجموعات بيانات صعبة. في قلب طريقتنا يوجد مجموعة من الوحدات المتكررة المغلقة (Gated Recurrent Units - GRU) المكدسة، طبقتان متصلتان بالكامل، ونموذج انتباه عالمي جديد. نقيم طريقتنا على سبع مجموعات بيانات متاحة للجمهور، تحتوي على أعداد مختلفة من العينات وتغطي نطاقًا واسعًا من التفاعلات (تفاعلات كاملة الجسم، تفاعلات متعددة الأطراف، إيماءات اليدين وغيرها). في جميع الحالات باستثناء حالة واحدة، نتفوق على الطرق الرائدة القائمة على الوضعية. على سبيل المثال، نحقق دقة اعتراف تبلغ 84.9% و92.3% في اختبارات العبور بين الأشخاص والعبور بين الزوايا لبيانات NTU RGB+D، وكذلك دقة اعتراف تبلغ 100% في بيانات UT-Kinect. بينما يعمل DeepGRU بشكل جيد على مجموعات بيانات كبيرة تحتوي على العديد من عينات التدريب، فإننا نظهر أنه حتى في غياب عدد كبير من عينات التدريب وفي وجود أربع عينات فقط لكل فئة، يمكن لـ DeepGRU أن يتخطى الطرق التقليدية المصممة خصيصًا لمجموعات تدريب صغيرة. أخيرًا، نثبت أنه حتى بدون أجهزة قوية واستخدام المعالج فقط (CPU)، يمكن تدريب طريقتنا في أقل من 10 دقائق على مجموعات بيانات صغيرة الحجم، مما يجعلها خيارًا جاذبًا لتطوير النماذج الأولية السريعة والتطبيقات.请注意,我已经根据您的要求进行了翻译,并确保了内容的准确性、表达的流畅性、表述的正式性以及对原文的高度忠实。如果您有任何进一步的要求或需要调整的地方,请随时告知。