DualPoseNet: تقدير وضعية وحجم الأشياء على مستوى الفئة باستخدام شبكة وضعية مزدوجة مع تعلم محسن للاستقرار الوضعي

تقدير وضع الكائنات وحجمها بستة درجات من الحرية (6D) على مستوى الفئة هو التنبؤ بتكوينات الوضع الكاملة للدوران والترجمة والحجم لحالات الكائنات الملاحظة في مشاهد مفرغة بشكل عشوائي. في هذا البحث، نقترح طريقة جديدة تُسمى شبكة الوضع الثنائية مع تعلم مكرر لتوافق الوضع لهذه المهمة، والتي يتم اختصارها إلى DualPoseNet. تقوم DualPoseNet بتجميع محولين للوضع بشكل متوازي فوق مُشفر الوضع المشترك، حيث يقوم المحول الضمني بالتنبؤ بأوضاع الكائنات باستخدام آلية عمل مختلفة عن تلك المستخدمة في المحول الصريح؛ وهكذا يفرضان إشرافًا مكملًا على تدريب مشفر الوضع. نقوم ببناء المشفر على أساس الإنشاءات الكروية، ونصمم وحدة اندماج كروي (Spherical Fusion) لتحقيق تمثيل أفضل للميزات الحساسة للوضع من الملاحظات الشكلية والمظهرية. بدون وجود نماذج CAD اختبارية، فإن تقديم المحول الضمني بطريقة جديدة يتيح التنبؤ الدقيق بالوضع أثناء الاختبار، وذلك من خلال فرض توافق الوضع المتوقع بين المحولين باستخدام حد خسارة ذاتي التكيف. تؤكد التجارب الشاملة على مقاييس الأداء لكل من بيانات أوضاع الكائنات على مستوى الفئة وعلى مستوى الحالة فعالية تصاميمنا. تتفوق DualPoseNet على الأساليب الموجودة بمقدار كبير في مجال الدقة العالية. تم إطلاق شفرتنا المصدر بشكل عام على الرابط https://github.com/Gorilla-Lab-SCUT/DualPoseNet.