خسارة البؤرة المعممة V2: تعلم تقدير جودة التحديد الموثوق به للكشف الكثيف عن الأشياء

التقدير الجغرافي للجودة (LQE) يعد أمرًا حاسمًا وشائعًا في التطور الحديث للكاشفات الكثيفة للأجسام، حيث يمكنه توفير درجات تصنيف دقيقة تفيد عملية القمع غير القصوى (Non-Maximum Suppression) وتحسن أداء الكشف. كممارسات شائعة، تقوم معظم الطرق الحالية بتوقع درجات LQE من خلال ميزات التحويل الشائكة التي تشترك مع تصنيف الأجسام أو الانحدار المربع المحيط. في هذا البحث، نستكشف وجهة نظر جديدة تمامًا ومختلفة لأداء LQE -- وهي تعتمد على التوزيعات المستفادة من الأربعة معلمات للمربع المحيط. تم إلهام وتوضيح هذه التوزيعات وإدخالها كـ "توزيع عام" (General Distribution) في GFLV1، والتي تصف عدم اليقين في المربعات المحيطة المتوقعة بشكل جيد. يمنح هذا الخاصية ارتباطًا عاليًا بين إحصائيات التوزيع وجودة التعريف الفعلية للمربع المحيط. بصفة خاصة، يتوافق توزيع المربع المحيط ذو الذروة الحادة غالبًا مع جودة تعريف عالية، والعكس صحيح. من خلال الاستفادة من الارتباط الوثيق بين إحصائيات التوزيع وجودة التعريف الفعلية، قمنا بتطوير متنبئ جودة خفيف الوزن بشكل كبير وموجه بالتوزيع (DGQP) لتقديم LQE موثوقة بناءً على GFLV1، مما يؤدي إلى ظهور GFLV2. حسب علمنا، هو أول محاولة في مجال كشف الأجسام لاستخدام تمثيل إحصائي ذي صلة عالية لتسهيل LQE. أثبتت التجارب الواسعة فعالية طريقتنا. وبشكل ملفت للنظر، يصل GFLV2 (ResNet-101) إلى دقة AP 46.2 بمعدل 14.6 إطار في الثانية على مجموعة اختبار COCO {\tt test-dev}، مما يتفوق على أساس ATSS السابق الأفضل (43.6 AP بمعدل 14.6 إطار في الثانية) بمقدار 2.6 AP مطلق دون التضحية بالكفاءة سواء أثناء التدريب أو الاستدلال. سيتم توفير الرمز البرمجي عبر الرابط: https://github.com/implus/GFocalV2.