HyperAIHyperAI

Command Palette

Search for a command to run...

إلى ممارسات جيدة لتقدير وضع اليد ثلاثية الأبعاد العميقة

Guo Hengkai Wang Guijin Chen Xinghao Zhang Cairong

الملخص

يُعد استخلاص وضعية اليد ثلاثية الأبعاد من صورة عمق واحدة مشكلة مهمة وصعبة في مجال التفاعل بين الإنسان والحاسوب. في الآونة الأخيرة، تم استخدام الشبكات العصبية التلافيفية العميقة (ConvNet) ذات التصميم المعقد لمعالجة هذه المشكلة، لكن التحسن مقارنة بالطرق التقليدية القائمة على الغابة العشوائية لم يكن ملحوظًا بشكل كبير. وللاستفادة من الممارسات الجيدة وتعزيز الأداء في استخلاص وضعية اليد، نقترح شبكة مُجمّعة من المناطق ذات البنية الشجرية (REN) لاسترجاع إحداثيات ثلاثية الأبعاد بشكل مباشر. تبدأ هذه الشبكة بتقسيم النواتج النهائية للطبقة التلافيفية في شبكة ConvNet إلى عدة مناطق شبكيّة. ثم تُدمج النتائج الناتجة من مُعدّلات متعددة (FC) تعمل بشكل منفصل على كل منطقة عبر طبقة متعددة الروابط (FC) إضافية لإجراء التقدير. وباستخدام استراتيجيات تدريب متعددة، منها تكبير البيانات ووظيفة الخسارة السلسة من النوع L1L_1L1، يمكن للشبكة المقترحة REN تحسين الأداء بشكل ملحوظ مقارنة بـ ConvNet في تحديد مواقع مفاصل اليد. وأظهرت النتائج التجريبية أن منهجنا يحقق أفضل أداء بين الخوارزميات الرائدة في مجال استخلاص وضعية اليد على ثلاث مجموعات بيانات عامة متاحة للعامة. كما قمنا أيضًا بتجريب منهجنا على مهام كشف أطراف الأصابع وتحديد وضعية الجسم البشري، حيث تم تحقيق دقة تُعدّ من أفضل المستويات الحالية في هذه المجالات.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
إلى ممارسات جيدة لتقدير وضع اليد ثلاثية الأبعاد العميقة | مستندات | HyperAI