تقدير وضعية الكائن ثلاثي الأبعاد المستند إلى التقطيع

أحدث الاتجاهات في تقدير وضع الأجسام الصلبة بستة أبعاد هو تدريب الشبكات العميقة إما لتقدير الوضع مباشرة من الصورة أو لتوقع مواقع النقاط الرئيسية ثلاثية الأبعاد على شكل مواقع ثنائية الأبعاد، ومن ثم يمكن الحصول على الوضع باستخدام خوارزمية PnP (المطابقة النقطية). في كلا الحالتين، يتم التعامل مع الجسم ككيان عالمي، ويتم حساب تقدير واحد للوضع. نتيجة لذلك، يمكن أن تكون التقنيات الناتجة عرضة للتغطيات الكبيرة.في هذا البحث، نقدم إطارًا لتقدير الوضع بستة أبعاد يعتمد على التجزئة، حيث يساهم كل جزء مرئي من الأجسام في توقع محلي للوضع على شكل مواقع نقاط رئيسية ثنائية الأبعاد. بعد ذلك، نستخدم مقياس الثقة المتوقع لدمج هذه المرشحات للوضع في مجموعة صلبة من المطابقات بين ثلاثية الأبعاد وثنائية الأبعاد، منها يمكن الحصول على تقدير موثوق للوضع. نتفوق على أفضل التقنيات الحالية في مجموعتي البيانات الصعبتين Occluded-LINEMOD و YCB-Video، مما يدل على أن نهجنا يتعامل بشكل جيد مع عدة أجسام ذات نسيج ضعيف تغطي بعضها البعض. بالإضافة إلى ذلك، يعتمد على هندسة بسيطة بما فيه الكفاية لتحقيق أداء في الوقت الحقيقي.