HyperAIHyperAI

Command Palette

Search for a command to run...

FreiHAND: مجموعة بيانات لالتقاط وضعية اليد وشكلها دون استخدام علامات من صور RGB فردية

Christian Zimmermann Duygu Ceylan Jimei Yang Bryan Russell Max Argus Thomas Brox

الملخص

تقدير وضع اليد ثلاثي الأبعاد من صور RGB أحادية يُعد مشكلة ذات غموض عالٍ تعتمد على مجموعة بيانات تدريب خالية من التحيز. في هذه الورقة، نحلل قدرة التعميم بين مجموعات البيانات عند التدريب على مجموعات البيانات الحالية. ونجد أن النماذج تؤدي بشكل جيد على المجموعات التي تم تدريبها عليها، لكنها لا تُظهر قدرة على التعميم على مجموعات بيانات أخرى أو في سياقات واقعية (in-the-wild). كنتيجة لذلك، نقدم أول مجموعة بيانات كبيرة النطاق، متعددة الزوايا، تُرفق بملامح ثلاثية الأبعاد للوضع والشكل اليدوي. وللتمييز على هذه المجموعة البيانات الواقعية، نقترح نهجًا تكراريًا شبه آليًا يُعرف بـ "الإنسان في الحلقة" (human-in-the-loop)، والذي يشمل تحسين عملية تكييف اليد لاستنتاج كل من الوضع ثلاثي الأبعاد والشكل للعينة الواحدة. ونُظهر أن النماذج المدربة على مجموعتنا تُظهر أداءً متسقًا جيدًا عند اختبارها على مجموعات بيانات أخرى. علاوةً على ذلك، تُمكّن هذه المجموعة البيانات من تدريب شبكة تتنبأ بالشكل الكامل المُتَنَوِّع لليد من صورة RGB واحدة. ويمكن أن تُستخدم مجموعة التقييم كمعيار مرجعي (benchmark) لتقدير الشكل المُتَنَوِّع لليد.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
FreiHAND: مجموعة بيانات لالتقاط وضعية اليد وشكلها دون استخدام علامات من صور RGB فردية | مستندات | HyperAI