Command Palette
Search for a command to run...
HandOS: إعادة بناء اليد ثلاثية الأبعاد في مرحلة واحدة
HandOS: إعادة بناء اليد ثلاثية الأبعاد في مرحلة واحدة
Xingyu Chen Zhuheng Song Xiaoke Jiang Yaoqing Hu Junzhi Yu Lei Zhang
الملخص
الطرق الحالية لإعادة بناء اليد تميل بشكل أساسي إلى اتباع إطار عمل متعدد المراحل، يشمل الكشف، تصنيف اليمين واليسار، وتقدير الوضع. هذا النموذج يؤدي إلى حسابات زائدة وأخطاء تراكمية. في هذا البحث، نقترح HandOS، وهو إطار عمل من النهاية إلى النهاية لإعادة بناء اليد ثلاثية الأبعاد. دوافعنا الرئيسية تكمن في الاستفادة من كاشف مجمد كأساس مع إضافة وحدات مساعدة لتقدير النقاط الرئيسية ثنائية الأبعاد وثلاثية الأبعاد. بهذه الطريقة، ندمج قدرة تقدير الوضع في إطار العمل الكشفي بينما نلغي في الوقت نفسه الحاجة إلى استخدام فئة اليمين واليسار كشرط مسبق. تحديداً، نقترح محول 2D-3D تفاعليًا، حيث يتم استنتاج معاني المفاصل ثنائية الأبعاد من مؤشرات الكشف بينما يتم رفع التمثيل ثلاثي الأبعاد من تلك المفاصل ثنائية الأبعاد. بالإضافة إلى ذلك، تم تصميم انتباه هرمي لتمكين النمذجة المتزامنة للمفاصل ثنائية الأبعاد، الرؤوس ثلاثية الأبعاد، وترجمة الكاميرا. وبالتالي، نحقق دمجًا من النهاية إلى النهاية لكشف اليد، تقدير وضع 2D، وإعادة بناء الشبكة 3D ضمن إطار عمل مرحلة واحدة، بحيث يتم التغلب على عيوب الإطارات المتعددة المراحل. وفي الوقت نفسه، يصل HandOS إلى أداء رائد على مقاييس عامة مثل 5.0 PA-MPJPE على FreiHand و 64.6٪ [email protected] على HInt-Ego4D. صفحة المشروع: idea-research.github.io/HandOSweb.