HyperAIHyperAI
منذ 17 أيام

UPose3D: تقدير موضع الإنسان ثلاثي الأبعاد المُدرك للعدم مع ميزات متعددة الأنظار والزمنية

Vandad Davoodnia, Saeed Ghorbani, Marc-André Carbonneau, Alexandre Messier, Ali Etemad
UPose3D: تقدير موضع الإنسان ثلاثي الأبعاد المُدرك للعدم مع ميزات متعددة الأنظار والزمنية
الملخص

نُقدّم UPose3D، منهجية جديدة لتقدير وضعية الإنسان ثلاثية الأبعاد من عدة زوايا، وتُعالج التحديات المتعلقة بالدقة والقابلية للتوسع. تُحسّن منهجيتنا الإطارات الحالية لتقدير الوضعية من خلال تعزيز المرونة والقدرة على التحمل دون الحاجة إلى تسميات ثلاثية الأبعاد مباشرة. في قلب منهجيتنا، يُعدّ وحدة مُجمّع الوضعية (pose compiler module) التي تُحسّن التقديرات الناتجة عن مُقدّر النقاط الثنائية الأبعاد (2D keypoints estimator) الذي يعمل على صورة واحدة، وذلك من خلال الاستفادة من المعلومات الزمنية والمعلومات المتقاطعة بين الزوايا المختلفة. تتميز استراتيجيتنا الجديدة لدمج البيانات من زوايا متعددة بالقابلية للتوسع إلى أي عدد من الكاميرات، بينما تضمن استراتيجيتنا لتكوين البيانات الاصطناعية تعميمًا فعّالًا عبر أشخاص متنوعين، ومشاهد مختلفة، وأوضاع رؤية متفاوتة. وأخيرًا، يستفيد UPose3D من مستوى عدم اليقين في التقديرات الناتجة عن كل من مُقدّر النقاط الثنائية الأبعاد ووحدة مُجمّع الوضعية. وهذا يُعزز مقاومة النموذج للقيم الشاذة والبيانات المُشوّشة، مما يؤدي إلى أداء متميز على مستوى الحالة الراهنة (state-of-the-art) في البيئات الخارجة عن التوزيع (out-of-distribution). وبالإضافة إلى ذلك، في البيئات التي تقع ضمن التوزيع (in-distribution)، يُحقق UPose3D أداءً يُنافس الطرق التي تعتمد على بيانات مُعلّمة ثلاثية الأبعاد، مع أنّه يظل الأفضل بين الطرق التي تعتمد فقط على التدريب ثنائي الأبعاد.

UPose3D: تقدير موضع الإنسان ثلاثي الأبعاد المُدرك للعدم مع ميزات متعددة الأنظار والزمنية | أحدث الأوراق البحثية | HyperAI