تقدير وضع الكائن المقاوم للإغلاق باستخدام تمثيل شامل

تتطلب تقديرات الوضع العملي للأجسام مرونة عالية تجاه الظلال التي تغطي الجسم المستهدف. تعتمد أحدث تقنيات تقدير الوضع للأشياء (SOTA) على نهج ثنائي المراحل، حيث يتنبأ المرحلة الأولى بـ 2D للنقاط المميزة باستخدام شبكة عميقة، بينما تُستخدم المرحلة الثانية لحساب الوضع بـ 6 درجات من الحرية من خلال التوافق بين النقاط 2D و3D. وعلى الرغم من انتشار هذا النهج، إلا أنه قد يعاني من ظروف ظلال جديدة عند التعميم، بالإضافة إلى ضعف انسجام النقاط المميزة الناتج عن تشويش الميزات. ولحل هذه المشكلات، نطور تقنية جديدة لتعزيز البيانات تُسمى "الإغلاق والتعطيل الجماعي" (occlude-and-blackout batch augmentation)، بهدف تعلم ميزات عميقة مقاومة للظلال، ونُنشئ هيكلًا متعدد الدقة للإشراف يُشجع على تعلم تمثيل شامل للوضع، مما يؤدي إلى تنبؤات دقيقة ومتزنة بالنقاط المميزة. قمنا بإجراء اختبارات تحليلية دقيقة للتحقق من تأثير ابتكاراتنا، وقورنا أسلوبنا مع أحدث الأساليب المُقدمة في مجال تقدير الوضع. وبلا حاجة لأي معالجة ما بعدية أو تحسين، يُظهر أسلوبنا أداءً متفوقًا على مجموعة بيانات LINEMOD. وعلى مجموعة بيانات YCB-Video، يتفوق أسلوبنا على جميع الأساليب غير المُعدّلة من حيث معيار ADD(-S). كما نُظهر كفاءة عالية في استخدام البيانات. يمكن الاطلاع على الكود الخاص بنا عبر الرابط: http://github.com/BoChenYS/ROPE