HyperAIHyperAI
منذ 2 أشهر

تعلم RoI Transformer للكشف عن الأجسام الموجهة في الصور الجوية

Jian Ding; Nan Xue; Yang Long; Gui-Song Xia; Qikai Lu
تعلم RoI Transformer للكشف عن الأجسام الموجهة في الصور الجوية
الملخص

اكتشاف الأشياء في الصور الجوية هو مهمة نشطة ومعقدة في مجال رؤية الحاسوب بسبب المنظور العلوي، الخلفيات المعقدة للغاية، ومظهر الأشياء المتغير. وبشكل خاص عند اكتشاف الأشياء المكدسة بشكل كثيف في الصور الجوية، فإن الطرق التي تعتمد على الاقتراحات الأفقية لاكتشاف الأشياء الشائعة غالبًا ما تُدخل اختلافات بين مناطق الاهتمام (RoIs) والأشياء. هذا يؤدي إلى الاختلال الشائع بين ثقة تصنيف الكائن النهائي ودقة تحديد موقعه. رغم استخدام الركائز الدوارة لحل هذه المشكلة، فإن تصميمها دائمًا يضاعف عدد الركائز ويزيد بشكل كبير من التعقيد الحسابي. في هذا البحث، نقترح متحول RoI (RoI Transformer) للتعامل مع هذه المشاكل. بدقة أكبر، لتحسين جودة اقتراحات المناطق، صممنا أولاً متعلم RoI دوار (RRoI Learner) لتحويل منطقة الاهتمام الأفقية (HRoI) إلى منطقة الاهتمام الدوارة (RRoI). بناءً على RRoIs، اقترحنا بعد ذلك وحدة تجميع RoI حساسة للموقع والموجهة بالدوران (RPS-RoI-Align) لاستخراج الميزات الثابتة أمام الدوران منها لتعزيز التصنيف والتراجع اللاحقين. يمكن أن يكون متحول RoI لدينا خفيف الوزن ويمكن تضمينه بسهولة في الكاشفات لاكتشاف الأجسام الموجهة. قد حقق تنفيذ بسيط لمتحول RoI أداءً عاليًا على مجموعة بيانات جوية شائعة ومعقدة هي DOTA و HRSC2016 مع انخفاض قليل جدًا في سرعة الاكتشاف. يتفوق متحول RoI الخاص بنا على تجميع RoI حساس للموقع القابل للتشوه عندما تكون هناك شروحات حدودية موجهة متاحة. كما أكدت التجارب الواسعة المرونة والفعالية لمتحول RoI الخاص بنا. تُظهر النتائج أنه يمكن دمجه بسهولة مع هياكل الكاشفات الأخرى وأنه يحسن الأداء بشكل كبير.请注意,这里的人名和机构名称(如DOTA和HRSC2016)通常在阿拉伯语中直接使用英文表示,以保持其专有名词的准确性。如果您需要这些名称的全称或其他详细信息,请告知我。