FCOS: الكشف عن الأشياء في مرحلة واحدة بالكامل باستخدام الشبكات العصبية المتكررة

نقترح محدد كائنات بالكامل باستخدام الشبكات العصبية التلافيفية (FCOS) لحل مشكلة تحديد الكائنات بطريقة التنبؤ لكل بكسل، مشابهة لتقطيع المعنى. تكاد جميع أحدث محددي الكائنات مثل RetinaNet و SSD و YOLOv3 و Faster R-CNN تعتمد على صناديق الربط المحددة مسبقًا. بخلاف ذلك، فإن المحدد المقترح لدينا FCOS لا يعتمد على صناديق الربط ولا على الاقتراحات. من خلال القضاء على مجموعة الصناديق المرتبطة المحددة مسبقًا، يتجنب FCOS تمامًا الحسابات المعقدة المتعلقة بصناديق الربط مثل حساب التداخل أثناء التدريب. وأهم من ذلك، نتجنب أيضًا جميع المعلمات الفائقة المرتبطة بصناديق الربط، والتي غالبًا ما تكون حساسة للغاية لأداء الكشف النهائي. باستخدام عملية المعالجة اللاحقة الوحيدة وهي قمع القيمة القصوى غير المتزامنة (NMS)، يصل FCOS مع ResNeXt-64x4d-101 إلى نسبة دقة 44.7% في AP عند اختبار النموذج الواحد والحجم الواحد، مما يتفوق على محددي الكائنات الأحاديين السابقين بميزة البساطة الكبيرة. وللمرة الأولى، نثبت أن إطار عمل الكشف البسيط والمروّن يمكن أن يحقق دقة كشف أفضل. نأمل أن يكون الإطار المقترح FCOS بديلًا بسيطًا وقويًا للعديد من المهام الأخرى على مستوى الحالة الفردية. يمكن الوصول إلى الشفرة البرمجية من الرابط التالي: https://tinyurl.com/FCOSv1