W-PoseNet: الانحدار المكاني للزوج البكسلي المُنظم بالتوافق الكثيف

حل مشكلة تقدير الوضعية الستية الأبعاد (6D pose estimation) ليس بالأمر السهل نظرًا للتغيرات الداخلية في المظهر والشكل والتداخل الشديد بين الأجرام، وهو يصبح أكثر تحديًا في ظل التغيرات الخارجية الكبيرة في الإضاءة وجودة البيانات المنخفضة التي يتم الحصول عليها في بيئة غير مراقبة. يقدم هذا البحث خوارزمية جديدة لتقدير الوضعية تُسمى W-PoseNet، والتي تقوم بالانحدار الكثيف من البيانات الدخول إلى الوضعية الستية الأبعاد وكذلك الإحداثيات الثلاثية الأبعاد في فضاء النموذج. بعبارة أخرى، يتم تنظيم الخصائص المحلية التي تم تعلمها للانحدار الوضعي في شبكتنا العميقة من خلال تعلم الخرائط المراسلة البكسلية صراحةً على الإحداثيات الحساسة للوضعية كمهمة مساعدة. علاوةً على ذلك، تم تصميم تركيبة زوجية نادرة من الخصائص البكسلية وتصويت ناعم على توقعات الوضعية للأزواج البكسلية لتحسين متانة الخوارزمية أمام الخصائص المحلية غير المتسقة والنادرة. أظهرت نتائج التجارب على مقاييس YCB-Video وLineMOD الشهيرة أن W-PoseNet المقترحة تحقق باستمرار أداءً أفضل من خوارزميات الطليعة (state-of-the-art algorithms).