HybridPose: تقدير وضعية الجسم الستة أبعاد تحت التمثيلات الهجينة

نُقدِّم "HybridPose"، وهي طريقة جديدة لتقدير الوضعية الستة أبعاد (6D) للكائنات. تعتمد HybridPose على تمثيل وسطي هجين لتمثيل معلومات هندسية مختلفة في الصورة المدخلة، بما في ذلك النقاط المميزة (keypoints)، ومتجهات الحواف (edge vectors)، وتطابقات التماثل (symmetry correspondences). مقارنةً بالتمثيل الموحّد، يُمكّن التمثيل الهجين لدينا نموذج التقدير من استغلال ميزات أكثر تنوعًا، حتى عند عدم دقة نوع معين من التمثيلات المُقدَّرة (مثلًا بسبب التغطية). يمكن لجميع التمثيلات الوسطية المستخدمة في HybridPose أن تُقدَّر بواسطة نفس الشبكة العصبية البسيطة، كما يتم التخلص من القيم الشاذة (outliers) في هذه التمثيلات المُقدَّرة من خلال وحدة انحدار قوية. مقارنةً بالطرق المتطورة الحالية لتقدير الوضعية، تُظهر HybridPose أداءً مماثلًا من حيث السرعة والدقة. على سبيل المثال، على مجموعة بيانات Occlusion Linemod، حققت طريقتنا سرعة تنبؤ تصل إلى 30 إطارًا في الثانية (30 fps) بدقة متوسطة ADD(-S) تبلغ 47.5٪، مما يمثل أداءً من الطراز الرائد (state-of-the-art). يمكن الوصول إلى التنفيذ العملي لـ HybridPose عبر الرابط التالي: https://github.com/chensong1995/HybridPose.