HyperAIHyperAI
منذ 11 أيام

غابة الانحدار بالاستطلاع العميقي لتقدير وضعية الإنسان ثلاثية الأبعاد من الصور

{Juergen Gall, Ilya Kostrikov}
الملخص

نُعالج مشكلة تقدير الوضع الثلاثي الأبعاد (3D Pose) من صور مونوكولار. ومع ذلك، بدلًا من تعلُّم دالة انحدار تُحوِّل ميزات الصورة إلى الوضع الكامل، نُنفِّذ انحدارًا لمواقع المفاصل في الفضاء الثلاثي الأبعاد، ثم نستنتج الوضع باستخدام إطار عمل هيكل صوري ثلاثي الأبعاد. لتنفيذ الانحدار، نعتمد على غابات الانحدار (Regression Forests)، التي أُثبتت فعاليتها في التنبؤ بالوضع ثنائي الأبعاد من الصور أو بالوضع الثلاثي الأبعاد من بيانات العمق. لكن هذه الأساليب لا يمكن تطبيقها مباشرة، لأن كل ميزة محلية من الصورة أو بيانات العمق تقدِّر المواقع النسبية للمفاصل بالنسبة إلى موقع الميزة. في حين أن الموضع النسبي يكون مُعرَّفًا بدقة إذا كانت مواقع الميزة والمفاصل معطاة إما في بُعدَيْن أو في ثلاثة أبعاد، فإنه لا يكون مُعرَّفًا بشكل واضح إذا كانت الميزات تُستخلص من صور ثنائية الأبعاد دون معلومات عمق، بينما يجب توقع مواقع المفاصل في نظام إحداثيات ثلاثي الأبعاد.

غابة الانحدار بالاستطلاع العميقي لتقدير وضعية الإنسان ثلاثية الأبعاد من الصور | أحدث الأوراق البحثية | HyperAI