HyperAIHyperAI
منذ 17 أيام

R-CNN المُوجَّه للكشف عن الكائنات

Xingxing Xie, Gong Cheng, Jiabao Wang, Xiwen Yao, Junwei Han
R-CNN المُوجَّه للكشف عن الكائنات
الملخص

الكواشف ثنائية المراحل الحديثة الحد الأقصى تُنتج اقتراحات موجهة من خلال أساليب تستهلك وقتًا طويلاً، مما يقلل من سرعة الكواشف، وبالتالي يصبح العائق الحسابي الرئيسي في أنظمة الكشف المتطورة عن الكائنات الموجهة. يقترح هذا العمل إطارًا فعّالًا وبسيطًا للكشف عن الكائنات الموجهة، يُسمّى Oriented R-CNN، وهو كاشف ثنائي المراحل عام يمتلك دقة وفعالية واعدة. بشكل محدد، في المرحلة الأولى، نقترح شبكة اقتراح مناطق موجهة (oriented RPN) تُنتج اقتراحات موجهة عالية الجودة بطريقة شبه مجانية من حيث التكلفة. أما المرحلة الثانية فهي رأس Oriented R-CNN لتحسين المناطق الموجهة ذات الاهتمام (oriented RoIs) وتصنيفها. وبلا استخدام أي تقنيات مُضافة، يحقق Oriented R-CNN باستخدام ResNet50 دقة كشف متقدمة على نوعين شائعي الاستخدام من مجموعات البيانات الخاصة بالكشف عن الكائنات الموجهة، وهما DOTA (75.87% mAP) وHRSC2016 (96.50% mAP)، مع سرعة تصل إلى 15.1 إطارًا في الثانية (FPS) عند استخدام حجم صورة 1024×1024 على بطاقة RTX 2080Ti واحدة. نأمل أن يُحفّز هذا العمل على إعادة التفكير في تصميم كواشف الكائنات الموجهة، ويُشكّل قاعدة مرجعية للكشف عن الكائنات الموجهة. يمكن الاطلاع على الكود عبر الرابط: https://github.com/jbwang1997/OBBDetection.