HyperAIHyperAI
منذ 2 أشهر

تقدير الوضع ثلاثي الأبعاد لعدة أشخاص من صورة مونوكولار RGB في تصوير واحد

Mehta, Dushyant ; Sotnychenko, Oleksandr ; Mueller, Franziska ; Xu, Weipeng ; Sridhar, Srinath ; Pons-Moll, Gerard ; Theobalt, Christian
تقدير الوضع ثلاثي الأبعاد لعدة أشخاص من صورة مونوكولار RGB في تصوير واحد
الملخص

نقترح طريقة جديدة ذات مرحلة واحدة لتقدير وضعية ثلاثية الأبعاد لأكثر من شخص في مشاهد عامة باستخدام كاميرا RGB أحادية العدسة. تستخدم نهجتنا خرائط وضعية مقاومة للإخفاء (ORPM) الجديدة، والتي تمكننا من استنتاج وضعية الجسم الكاملة حتى تحت الإخفاء الجزئي القوي من قبل الأشخاص والأشياء الأخرى في المشهد. تنتج الخرائط المقاومة للإخفاء عددًا ثابتًا من الخرائط التي تحتوي على مواقع المفاصل ثلاثية الأبعاد لجميع الأشخاص في المشهد. تسمح لنا ارتباطات أجزاء الجسم باستنتاج وضعية ثلاثية الأبعاد لعدد غير محدد من الأشخاص دون التنبؤ بصناديق الحدود بشكل صريح. لتدريب نهجتنا، قدمنا مجموعة بيانات التدريب MuCo-3DHP، وهي أول مجموعة بيانات كبيرة تعرض صورًا حقيقية لمتداخلات متعددة الأشخاص ومعقدة والإخفاءات. قمنا بتركيب صور متعددة للأشخاص (مع الحقائق الأرضية من التقاط الأداء متعدد الزوايا) لإنشاء مكتبة كبيرة من الصور المتعددة الأشخاص. نقيم طريقتنا على مجموعة الاختبار الجديدة MuPoTs-3D، وهي مجموعة اختبار معقدة ومُعلَّمة بالبيانات ثلاثية الأبعاد حيث نحقق أداءً رائدًا في هذا المجال. لتحفيز البحث أكثر في تقدير وضعية ثلاثية الأبعاد للأفراد المتعددين، سنقوم بتوفير مجموعات البيانات الجديدة ورموز البرمجة المرتبطة بها بشكل عام لأغراض البحث.