HyperAIHyperAI
منذ 2 أشهر

العين الواحدة، المرحلة الواحدة، تقدير متعدد للأشخاص الثلاثية الأبعاد

Sun, Yu ; Bao, Qian ; Liu, Wu ; Fu, Yili ; Black, Michael J. ; Mei, Tao
العين الواحدة، المرحلة الواحدة، تقدير متعدد للأشخاص الثلاثية الأبعاد
الملخص

يركز هذا البحث على تقدير أشكال ثلاثية الأبعاد لعدة أشخاص من صورة واحدة باللون والضوء (RGB). تستخدم الطرق الحالية بشكل أساسي خطوات متعددة، حيث يتم اكتشاف الأشخاص أولاً داخل مربعات حصرية ومن ثم تقدير شبكات أجسادهم الثلاثية الأبعاد بشكل مستقل. بخلاف ذلك، نقترح طريقة تقدير جميع الشبكات في مرحلة واحدة لعدة أشخاص ثلاثيين الأبعاد (وقد تم تسميتها ROMP). هذه الطريقة مفهومياً بسيطة، وخالية من المربعات الحصرية، وقادرة على تعلم تمثيل لكل بكسل بطريقة شاملة. يتنبأ نظامنا في الوقت نفسه بخريطة حرارية للمركز الجسدي وخريطة معلمات الشبكة، والتي يمكن أن تصف شبكة الجسم الثلاثية الأبعاد على مستوى البكسل. من خلال عملية عينية موجهة بالمركز الجسدي، يتم استخراج معلمات شبكة الجسم لجميع الأشخاص في الصورة بسهولة من خريطة معلمات الشبكة. بفضل هذا التمثيل الدقيق، فإن إطار عملنا ذو المرحلة الواحدة خالٍ من العملية المعقدة ذات المراحل المتعددة وأكثر قوة في التعامل مع الإخفاء. عند المقارنة مع أفضل الطرق الحالية، حقق ROMP أداءً فائقاً على مقاييس التحدي المتعددة للأفراد مثل 3DPW و CMU Panoptic. تُظهر التجارب على مجموعة بيانات مزدحمة/محجوبة قدرته على تحمل أنواع مختلفة من الإخفاء. يعتبر الكود المُطلق أول تنفيذ في الوقت الفعلي لتقدير شبكات عدة أشخاص ثلاثية الأبعاد باستخدام كاميرا واحدة (monocular multi-person 3D mesh regression).

العين الواحدة، المرحلة الواحدة، تقدير متعدد للأشخاص الثلاثية الأبعاد | أحدث الأوراق البحثية | HyperAI