فك شفرة الكشف عن الأشياء ثلاثية الأبعاد من صورة واحدة

في هذا البحث، نقترح منهجية للكشف عن الأشياء ثلاثية الأبعاد من صورة واحدة باللون والضوء الأحمر (RGB)، والتي تستفيد من تحويل فك التشابك الجديد للخسائر الكشف ثنائية وثلاثية الأبعاد، ومن درجة الثقة الذاتية المراقبة الجديدة للصناديق الحدودية ثلاثية الأبعاد. يوفر التحويل المقترح لفك التشابك في الخسائر ميزة مزدوجة تتمثل في تبسيط الديناميكيات التدريبية في وجود خسائر ذات تفاعلات معقدة للمعلمات، وفي تجنب مشكلة موازنة المصطلحات الانحدارية المستقلة. يتغلب حلنا على هذه المشكلات بعزل المساهمة التي تقدمها مجموعات المعلمات إلى خسارة معينة دون تغيير طبيعتها. نقوم أيضًا بتطبيق فك التشابك في الخسائر على معيار جديد آخر يتمثل في تقاطع الإشارة (signed Intersection-over-Union) لتحسين نتائج الكشف ثنائية الأبعاد.بالإضافة إلى الابتكارات المنهجية لدينا، نراجع بشكل نقدي مؤشر الدقة المتراكمة (AP) المستخدم في مجموعة بيانات KITTI3D، والتي ظهرت كأهم مجموعة بيانات لمقارنة نتائج الكشف ثلاثي الأبعاد. نحدد ونحل مشكلة في مؤشر الدقة المتراكمة المحمل بـ 11 نقطة (11-point interpolated AP)، والذي يؤثر على جميع النتائج المنشورة سابقًا ويتحيز بشكل خاص ضد نتائج الكشف ثلاثي الأبعاد أحادي العين. نقدم تقييمات تجريبية شاملة ودراسات تقليص على مجموعتي بيانات KITTI3D و nuScenes، مما يضع نتائج جديدة رائدة في مجال تصنيف السيارات بأرقام كبيرة.