CullNet: درجات ثقة مُعدَّلة وواعية بالوضعية لتقدير وضعية الكائن

نقدم منهجية جديدة لتقدير وضعية الكائن من صورة واحدة باستخدام الصور. وبشكل خاص، يتناول هذا البحث مشكلة التخلص من التنبؤات الخاطئة (الإيجابيات الكاذبة) بين عدة تنبؤات لوضعية الكائن. يركز المنهج المقترح على مشكلة القيم غير الدقيقة لدرجة الثقة التي تتنبأ بها الشبكات العصبية التلافيفية (CNNs)، والتي تُستخدمها العديد من الطرق الحديثة لاختيار التنبؤ النهائي بوضعية الكائن. نقدم شبكة تُسمى CullNet، التي تُعالج هذه المهمة. تأخذ CullNet أزواجًا من أقنعة الوضعية التي تم عرضها من نموذج ثلاثي الأبعاد، بالإضافة إلى مناطق مقطوعة من الصورة الأصلية كمدخلات. ثم تُستخدم هذه المدخلات لمعايرة درجات الثقة الخاصة بتوقعات الوضعية. وتبين نتائجنا أن هذه المجموعة الجديدة من درجات الثقة تكون أكثر موثوقية بشكل ملحوظ في تقدير وضعية الكائن بدقة، كما يُظهر ذلك أداءنا التجريبي. تعكس نتائج التجارب لدينا على عدة مجموعات بيانات صعبة (LINEMOD وOcclusion LINEMOD) فعالية المنهج المقترح. وتفوق خطتنا الشاملة لتقدير الوضعية الطرق الرائدة في مجال تقدير وضعية الكائنات على مجموعات البيانات القياسية المعتمدة في هذا المجال. وتم إتاحة الكود المصدر لدينا للجمهور عبر الرابط التالي: https://github.com/kartikgupta-at-anu/CullNet.