Command Palette
Search for a command to run...
إلى ممارسات جيدة لتقدير وضع اليد ثلاثية الأبعاد العميقة
إلى ممارسات جيدة لتقدير وضع اليد ثلاثية الأبعاد العميقة
Guo Hengkai Wang Guijin Chen Xinghao Zhang Cairong
الملخص
يُعد استخلاص وضعية اليد ثلاثية الأبعاد من صورة عمق واحدة مشكلة مهمة وصعبة في مجال التفاعل بين الإنسان والحاسوب. في الآونة الأخيرة، تم استخدام الشبكات العصبية التلافيفية العميقة (ConvNet) ذات التصميم المعقد لمعالجة هذه المشكلة، لكن التحسن مقارنة بالطرق التقليدية القائمة على الغابة العشوائية لم يكن ملحوظًا بشكل كبير. وللاستفادة من الممارسات الجيدة وتعزيز الأداء في استخلاص وضعية اليد، نقترح شبكة مُجمّعة من المناطق ذات البنية الشجرية (REN) لاسترجاع إحداثيات ثلاثية الأبعاد بشكل مباشر. تبدأ هذه الشبكة بتقسيم النواتج النهائية للطبقة التلافيفية في شبكة ConvNet إلى عدة مناطق شبكيّة. ثم تُدمج النتائج الناتجة من مُعدّلات متعددة (FC) تعمل بشكل منفصل على كل منطقة عبر طبقة متعددة الروابط (FC) إضافية لإجراء التقدير. وباستخدام استراتيجيات تدريب متعددة، منها تكبير البيانات ووظيفة الخسارة السلسة من النوع L1، يمكن للشبكة المقترحة REN تحسين الأداء بشكل ملحوظ مقارنة بـ ConvNet في تحديد مواقع مفاصل اليد. وأظهرت النتائج التجريبية أن منهجنا يحقق أفضل أداء بين الخوارزميات الرائدة في مجال استخلاص وضعية اليد على ثلاث مجموعات بيانات عامة متاحة للعامة. كما قمنا أيضًا بتجريب منهجنا على مهام كشف أطراف الأصابع وتحديد وضعية الجسم البشري، حيث تم تحقيق دقة تُعدّ من أفضل المستويات الحالية في هذه المجالات.