HyperAIHyperAI

Command Palette

Search for a command to run...

العين الواحدة، المرحلة الواحدة، تقدير متعدد للأشخاص الثلاثية الأبعاد

Yu Sun Qian Bao Wu Liu Yili Fu Michael J. Black Tao Mei

الملخص

يركز هذا البحث على تقدير أشكال ثلاثية الأبعاد لعدة أشخاص من صورة واحدة باللون والضوء (RGB). تستخدم الطرق الحالية بشكل أساسي خطوات متعددة، حيث يتم اكتشاف الأشخاص أولاً داخل مربعات حصرية ومن ثم تقدير شبكات أجسادهم الثلاثية الأبعاد بشكل مستقل. بخلاف ذلك، نقترح طريقة تقدير جميع الشبكات في مرحلة واحدة لعدة أشخاص ثلاثيين الأبعاد (وقد تم تسميتها ROMP). هذه الطريقة مفهومياً بسيطة، وخالية من المربعات الحصرية، وقادرة على تعلم تمثيل لكل بكسل بطريقة شاملة. يتنبأ نظامنا في الوقت نفسه بخريطة حرارية للمركز الجسدي وخريطة معلمات الشبكة، والتي يمكن أن تصف شبكة الجسم الثلاثية الأبعاد على مستوى البكسل. من خلال عملية عينية موجهة بالمركز الجسدي، يتم استخراج معلمات شبكة الجسم لجميع الأشخاص في الصورة بسهولة من خريطة معلمات الشبكة. بفضل هذا التمثيل الدقيق، فإن إطار عملنا ذو المرحلة الواحدة خالٍ من العملية المعقدة ذات المراحل المتعددة وأكثر قوة في التعامل مع الإخفاء. عند المقارنة مع أفضل الطرق الحالية، حقق ROMP أداءً فائقاً على مقاييس التحدي المتعددة للأفراد مثل 3DPW و CMU Panoptic. تُظهر التجارب على مجموعة بيانات مزدحمة/محجوبة قدرته على تحمل أنواع مختلفة من الإخفاء. يعتبر الكود المُطلق أول تنفيذ في الوقت الفعلي لتقدير شبكات عدة أشخاص ثلاثية الأبعاد باستخدام كاميرا واحدة (monocular multi-person 3D mesh regression).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp