التقاط جسم الإنسان المغطى باستخدام أولوية الحركة المكانية-الزمانية ذاتية الإشراف

رغم التقدم الملحوظ الذي تحقق في التقاط حركة الإنسان بدون علامات باستخدام الكاميرا أحادية العدسة في السنوات الأخيرة، لا تزال الطرق الرائدة تعاني من صعوبة في الحصول على نتائج مرضية في حالات الإخفاء. هناك سببان رئيسيان لهذه المشكلة: الأول هو أن التقاط الحركة المخفية يحمل طابعًا غامضًا بطبيعته، حيث يمكن أن تتراكم العديد من الأوضاع ثلاثية الأبعاد إلى نفس المشاهدات ثنائية الأبعاد، مما يؤدي دائمًا إلى تقدير غير موثوق. والثاني هو عدم وجود بيانات كافية عن الإنسان المخفي لتدريب نموذج قوي. للتعامل مع هذه العقبات، فإن الفكرة الأساسية لدينا هي استخدام بيانات الإنسان غير المخفي لتعلم أولوية حركية زمانية-مكانية على مستوى المفاصل للإنسان المخفي باستخدام استراتيجية ذاتية الإشراف. لخفض الفجوة بين البيانات المخفية الصناعية والبيانات الحقيقية، قمنا ببناء أول مجموعة بيانات للحركة ثلاثية الأبعاد المخفية (OcMotion)، والتي يمكن استخدامها للتدريب والاختبار. نقوم بتشفير الحركات في خرائط ثنائية الأبعاد وتصنيع الإخفاءات على البيانات غير المخفية للتدريب الذاتي بالإشراف الذاتي. ثم يتم تصميم طبقة زمانية-مكانية لتعلم العلاقات على مستوى المفاصل. الأولوية التي تم تعلمها تقلل من الغموض الناجم عن الإخفاء وتكون مقاومة لأنواع مختلفة من الإخفاء، مما يجعلها مفيدة في مساعدة التقاط حركة الإنسان المخفي. تظهر النتائج التجريبية أن طريقتنا قادرة على إنتاج حركات إنسانية دقيقة ومتناسقة من مقاطع الفيديو المخفية مع قدرة تعميم جيدة وكفاءة زمن تشغيل عالية. مجموعة البيانات والكود متاحان بشكل عام على الرابط \url{https://github.com/boycehbz/CHOMP}.