Command Palette
Search for a command to run...
C-MIDN: شبكة كشف متعددة الأمثلة متصلة بمرافقة التجزئة للكشف عن الكائنات المُدرَّب ضعيفًا
C-MIDN: شبكة كشف متعددة الأمثلة متصلة بمرافقة التجزئة للكشف عن الكائنات المُدرَّب ضعيفًا
Dongrui Fan Haihang You Fang Wan Xiaochun Ye Nan Guo Boxiao Liu Yan Gao
الملخص
تمثل الكشف عن الكائنات المُراقبة ضعيفًا (WSOD)، التي تتطلب فقط تسميات على مستوى الصورة، اهتمامًا كبيرًا في الآونة الأخيرة. وباستخدام دمج بين الشبكة العصبية التلافيفية (CNN) وطريقة التعلم متعدد المجموعات (MIL)، أصبحت الشبكة المتعددة لمُكتشفات المجموعات (MIDN) أكثر الطرق شيوعًا لمعالجة مشكلة WSOD، وتم اعتمادها كنموذج أولي في العديد من الدراسات. ونُقدِّم في هذا البحث رأيًا مفاده أن MIDN تميل إلى التقارب نحو أجزاء الكائن الأكثر تمييزًا، مما يحد من أداء الطرق القائمة عليها. ولحل هذه المشكلة، نُقدِّم شبكة MIDN المُتَّزِنة الجديدة (C-MIDN). وبشكل دقيق، نستخدم زوجًا من شبكات MIDN تعمل بأسلوب مكمل، مع إزالة الاقتراحات (proposal removal). كما نُدمج معلومات التحديد بين شبكتي MIDN للحصول على صناديق محددة أضيق، وتمكين تحديد أكثر من كائن واحد. بالإضافة إلى ذلك، نُقدِّم خوارزمية إزالة الاقتراحات المُوجهة بالتقسيم (SGPR) لضمان التزام قيد MIL بعد عملية الإزالة، وضمان متانة C-MIDN. وباستخدام تنفيذ بسيط لـ C-MIDN مع تحسين مُكتشف آني (online detector refinement)، نحقق تقييمًا بنسبة 53.6% و50.3% من متوسط الدقة (mAP) على معايير PASCAL VOC 2007 و2012 الصعبة على التوالي، مما يفوق بشكل كبير أفضل النتائج السابقة في هذا المجال.