HyperAIHyperAI

Command Palette

Search for a command to run...

HandOS: إعادة بناء اليد ثلاثية الأبعاد في مرحلة واحدة

Xingyu Chen Zhuheng Song Xiaoke Jiang Yaoqing Hu Junzhi Yu Lei Zhang

الملخص

الطرق الحالية لإعادة بناء اليد تميل بشكل أساسي إلى اتباع إطار عمل متعدد المراحل، يشمل الكشف، تصنيف اليمين واليسار، وتقدير الوضع. هذا النموذج يؤدي إلى حسابات زائدة وأخطاء تراكمية. في هذا البحث، نقترح HandOS، وهو إطار عمل من النهاية إلى النهاية لإعادة بناء اليد ثلاثية الأبعاد. دوافعنا الرئيسية تكمن في الاستفادة من كاشف مجمد كأساس مع إضافة وحدات مساعدة لتقدير النقاط الرئيسية ثنائية الأبعاد وثلاثية الأبعاد. بهذه الطريقة، ندمج قدرة تقدير الوضع في إطار العمل الكشفي بينما نلغي في الوقت نفسه الحاجة إلى استخدام فئة اليمين واليسار كشرط مسبق. تحديداً، نقترح محول 2D-3D تفاعليًا، حيث يتم استنتاج معاني المفاصل ثنائية الأبعاد من مؤشرات الكشف بينما يتم رفع التمثيل ثلاثي الأبعاد من تلك المفاصل ثنائية الأبعاد. بالإضافة إلى ذلك، تم تصميم انتباه هرمي لتمكين النمذجة المتزامنة للمفاصل ثنائية الأبعاد، الرؤوس ثلاثية الأبعاد، وترجمة الكاميرا. وبالتالي، نحقق دمجًا من النهاية إلى النهاية لكشف اليد، تقدير وضع 2D، وإعادة بناء الشبكة 3D ضمن إطار عمل مرحلة واحدة، بحيث يتم التغلب على عيوب الإطارات المتعددة المراحل. وفي الوقت نفسه، يصل HandOS إلى أداء رائد على مقاييس عامة مثل 5.0 PA-MPJPE على FreiHand و 64.6٪ [email protected] على HInt-Ego4D. صفحة المشروع: idea-research.github.io/HandOSweb.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp