التعرف السريع والقوي على إيماءات اليد الديناميكية من خلال استخراج الإطارات الرئيسية ودمج الخصائص

التعرف على الإيماءات هو موضوع ساخن في مجال رؤية الحاسوب وتعرف الأنماط، حيث يلعب دورًا حيويًا في واجهة التفاعل الطبيعية بين الإنسان والحاسوب. رغم التقدم الكبير الذي تحقق مؤخرًا، فإن التعرف السريع والثابت على إيماءات اليد لا يزال مشكلة مفتوحة، نظرًا لعدم تحقيق الأساليب الموجودة توازنًا جيدًا بين الأداء والكفاءة في آن واحد. لسد هذه الفجوة، يجمع هذا العمل بين انتروبيا الصورة والتجميع الكثيف لاستخراج الإطارات الرئيسية من مقاطع فيديو إيماءات اليد لإجراء استخلاص خصائص إضافي، مما يمكن أن يحسن كفاءة التعرف. بالإضافة إلى ذلك، تم اقتراح استراتيجية دمج الخصائص أيضًا لتحسين تمثيل الخصائص بشكل أكبر، مما يرفع مستوى أداء التعرف. للتحقق من صحة نهجنا في بيئة "حقيقية" (wild)، قمنا أيضًا بتقديم مجموعة بيانات جديدة تُسمى HandGesture وAction3D. أظهرت التجارب باستمرار أن استراتيجيتنا تحقق نتائج تنافسية على مجموعات البيانات الخاصة بإيماءات اليد من جامعة نورثويسترن وكامبريدج وHandGesture وAction3D. سيتم إطلاق شفرتنا ومجموعات البيانات الخاصة بنا على الرابط: https://github.com/Ha0Tang/HandGestureRecognition.