CPPF: نحو تقدير الوضع ثلاثي الأبعاد الدقيق للتصنيف في البيئات الحقيقية

في هذا البحث، نعالج مشكلة تقدير الوضعية ثلاثية الأبعاد التسعة (9D) على مستوى الفئة في بيئات حقيقية، باستخدام إطار واحد من نوع RGB-D. استخدام البيانات المشرف عليها للوضعيات الحقيقية ثلاثية الأبعاد التسعة (9D) يكون مرهقًا ومليئًا بالأخطاء، كما أنه يفشل في التعميم إلى السيناريوهات غير المعروفة. بالإضافة إلى ذلك، يتطلب تقدير الوضعية على مستوى الفئة أن تكون الطريقة قادرة على التعميم إلى الأجسام غير المعروفة عند الاختبار، وهو ما يعتبر تحديًا أيضًا.مستوحىً من الخصائص التقليدية للأزواج النقطية (PPFs)، صممنا في هذا البحث طريقة تصويت جديدة على مستوى الفئة للأزواج النقطية (CPPF) لتحقيق تقدير دقيق ومتين وقابل للتعميم للوضعيات ثلاثية الأبعاد التسعة (9D) في بيئات حقيقية. لضمان تقدير الوضعية المتين، نقوم بأخذ عينات من العديد من الأزواج النقطية على الجسم، ولكل زوج تتنبأ نموذجتنا بالإحصائيات اللازمة للتصويت الثابتة تحت مجموعة SE(3) حول مراكز الأجسام والتوجهات والأحجام. تم اقتراح خوارزمية تصويت جديدة تنتقل من الخشن إلى الدقيق لاستبعاد العينات الضوضائية للأزواج النقطية وإنتاج التوقعات النهائية من العينة.لتجنب الإشارات الكاذبة في عملية تصويت التوجه، تم تقديم مهمة تصنيف ثنائية مساعدة لكل زوج نقطي مُستَخَدَم. للكشف عن الأجسام في بيئات حقيقية، صممنا خط أنابيب المحاكاة إلى الواقع بعناية من خلال التدريب فقط على السحب النقاطية الصناعية، ما لم يكن هناك أوضاع غامضة هندسيًا للأجسام. في هذه الحالة، يتم الاستفادة من المعلومات اللونية لحل الغموض حول هذه الأوضاع.تشير النتائج على المقاييس القياسية إلى أن طرقتنا توازي أفضل الأساليب الحالية التي تعتمد على بيانات تدريب حقيقية. كما تظهر التجارب الواسعة أن طرقتنا متينة أمام الضوضاء وتقدم نتائج واعدة في سيناريوهات شديدة التعقيد. يمكن الوصول إلى كودنا عبر الرابط:https://github.com/qq456cvb/CPPF.