Command Palette
Search for a command to run...
فك شفرة الكشف عن الأشياء ثلاثية الأبعاد من صورة واحدة
فك شفرة الكشف عن الأشياء ثلاثية الأبعاد من صورة واحدة
Simonelli Andrea ; Bulò Samuel Rota Rota ; Porzi Lorenzo ; López-Antequera Manuel ; Kontschieder Peter
الملخص
في هذا البحث، نقترح منهجية للكشف عن الأشياء ثلاثية الأبعاد من صورة واحدة باللون والضوء الأحمر (RGB)، والتي تستفيد من تحويل فك التشابك الجديد للخسائر الكشف ثنائية وثلاثية الأبعاد، ومن درجة الثقة الذاتية المراقبة الجديدة للصناديق الحدودية ثلاثية الأبعاد. يوفر التحويل المقترح لفك التشابك في الخسائر ميزة مزدوجة تتمثل في تبسيط الديناميكيات التدريبية في وجود خسائر ذات تفاعلات معقدة للمعلمات، وفي تجنب مشكلة موازنة المصطلحات الانحدارية المستقلة. يتغلب حلنا على هذه المشكلات بعزل المساهمة التي تقدمها مجموعات المعلمات إلى خسارة معينة دون تغيير طبيعتها. نقوم أيضًا بتطبيق فك التشابك في الخسائر على معيار جديد آخر يتمثل في تقاطع الإشارة (signed Intersection-over-Union) لتحسين نتائج الكشف ثنائية الأبعاد.بالإضافة إلى الابتكارات المنهجية لدينا، نراجع بشكل نقدي مؤشر الدقة المتراكمة (AP) المستخدم في مجموعة بيانات KITTI3D، والتي ظهرت كأهم مجموعة بيانات لمقارنة نتائج الكشف ثلاثي الأبعاد. نحدد ونحل مشكلة في مؤشر الدقة المتراكمة المحمل بـ 11 نقطة (11-point interpolated AP)، والذي يؤثر على جميع النتائج المنشورة سابقًا ويتحيز بشكل خاص ضد نتائج الكشف ثلاثي الأبعاد أحادي العين. نقدم تقييمات تجريبية شاملة ودراسات تقليص على مجموعتي بيانات KITTI3D و nuScenes، مما يضع نتائج جديدة رائدة في مجال تصنيف السيارات بأرقام كبيرة.