الانحدار المربع مع عدم اليقين للكشف الدقيق عن الأشياء

تسعى مجموعات البيانات الكبيرة للكشف عن الأشياء (مثل MS-COCO) إلى تعريف الصناديق الحدودية للحقيقة الأرضية بأكبر قدر من الوضوح. ومع ذلك، نلاحظ أن الغموض لا يزال يدخل عند وضع علامات على الصناديق الحدودية. في هذا البحث، نقترح خسارة رجوع صندوق حدودي جديدة تتعلم تحويل الصندوق الحدودي وتباين التحديد معًا. تحسن هذه الخسارة دقة التحديد لأنواع مختلفة من المعماريات تقريبًا دون أي حساب إضافي. يسمح التباين المحدد الذي تم تعلمه لنا بدمج الصناديق الحدودية المجاورة أثناء القمع غير الأقصى (NMS)، مما يحسن أداء التحديد بشكل أكبر. على MS-COCO، نزيد من دقة الوسط (AP) لـ VGG-16 Faster R-CNN من 23.6٪ إلى 29.1٪. وأهم من ذلك، بالنسبة لـ ResNet-50-FPN Mask R-CNN، تحسن طريقتنا AP و AP90 بنسبة 1.8٪ و 6.2٪ على التوالي، مما يتفوق بشكل كبير على طرق تحسين الصندوق الحدودي السابقة التي كانت تعتبر الأكثر تقدمًا في هذا المجال. يمكن الوصول إلى شفرتنا وأنظمتنا عبر الرابط: github.com/yihui-he/KL-Loss