RFLA: تعيين التسمية القائم على مجال الاستقبال الغاوسي للكشف عن الكائنات الصغيرة

كشف الكائنات الصغيرة يُعدّ أحد العوائق الرئيسية التي تعيق تطور كشف الكائنات. فتتدهور أداء كاشفات الكائنات العامة بشكل كبير عند تطبيقها على مهام كشف الكائنات الصغيرة. في هذه الورقة، نشير إلى أن "المرجع المسبق للإطارات" (box prior) في كاشفات المُعدّات القائمة على المُستشعرات (anchor-based)، أو "المرجع المسبق للنقاط" (point prior) في كاشفات المُعدّات غير القائمة على المُستشعرات (anchor-free)، يكونان غير مثاليين للكائنات الصغيرة. وتشكل ملاحظتنا الأساسية أن نماذج تعيين التسميات الحالية، سواء القائمة على المُستشعرات أو غير القائمة عليها، تؤدي إلى تضمين العديد من العينات الصغيرة جدًا من البيانات الحقيقية (ground truth) كقيم شاذة (outliers)، ما يجعل الكاشفات تُولي اهتمامًا أقل للكائنات الصغيرة. ولحل هذه المشكلة، نقترح استراتيجية جديدة لتعيين التسميات تُسمى "تعيين التسميات القائم على مجال الاستقبال الغاوسي" (Gaussian Receptive Field based Label Assignment, RFLA) للكشف عن الكائنات الصغيرة. بشكل محدد، تعتمد RFLA على معلومة مسبقة تفيد بأن مجال الاستقبال للسمات يتبع توزيعًا غاوسيًا. ثم، بدلًا من تعيين العينات باستخدام معيار التداخل بين المربعات (IoU) أو استراتيجية أخذ العينات من المركز، نقترح مقياسًا جديدًا يُسمى "مسافة مجال الاستقبال" (Receptive Field Distance, RFD) لقياس التشابه مباشرة بين مجال الاستقبال الغاوسي والبيانات الحقيقية. وبما أن معايير IoU القائمة على العتبة واستراتيجية أخذ العينات من المركز تميلان إلى التفضيل للكائنات الكبيرة، فقد صممنا بشكل إضافي وحدة تسمى "تعيين التسميات الهرمية" (Hierarchical Label Assignment, HLA) تعتمد على RFD، بهدف تحقيق تعلم متوازن للكائنات الصغيرة. وقد أظهرت التجارب الواسعة على أربع مجموعات بيانات فعالية الطريقة المقترحة. وخصوصًا، تفوقت طريقة لدينا على أفضل الطرق الحالية بفارق 4.0 نقطة في مؤشر الدقة المتوسطة (AP) على مجموعة بيانات AI-TOD. يمكن الوصول إلى الشيفرة المصدرية عبر الرابط التالي: https://github.com/Chasel-Tsui/mmdet-rfla