العينة التمييزية للمقترحات في المتحولات ذاتية الإشراف لتحديد موقع الكائن بإشراف ضعيف

تُستخدم الطائرات بدون طيار في عدد متزايد من تطبيقات التعرف البصري. ومن بين التطورات الحديثة في فحص أبراج الخلايا، هناك مراقبة الأصول بالطائرات بدون طيار، حيث يتم توجيه الرحلة المستقلة للطائرة عن طريق تحديد مواقع الأشياء ذات الاهتمام في الصور الجوية المتتابعة. في هذا البحث، نقترح طريقة لتدريب نماذج التعرف على الأشياء برقابة ضعيفة (WSOL) العميقة باستخدام علامات تصنيف الصور فقط لتحديد موقع الشيء بثقة عالية. لتدريب محليناً، يتم حصاد العلامات الوهمية بكفاءة من متحولات الرؤية ذات الرقابة الذاتية (SSTs). ومع ذلك، بما أن SSTs تقوم بتقسيم المشهد إلى خرائط متعددة تحتوي على أجزاء مختلفة من الأشياء ولا تعتمد على أي إشارة رقابية صريحة، فهي لا تستطيع التمييز بين الشيء المطلوب والأشياء الأخرى كما يتطلب WSOL. لحل هذه المشكلة، نقترح الاستفادة من الخرائط المتعددة التي ينتجها الرؤوس المختلفة للمتحول لاستخلاص العلامات الوهمية لتدريب نموذج WSOL عميق. وبشكل خاص، تم تقديم طريقة جديدة للعينة المقترحة التمييزية (DiPS) تعتمد على تصنيف CNN لاكتشاف المناطق التمييزية. ثم يتم أخذ عينات من البكسلات الأمامية والخلفية من هذه المناطق لتدريب نموذج WSOL لإنتاج خرائط تنشيط يمكنها تحديد موقع الأشياء بدقة والتي تنتمي إلى فئة معينة. تشير النتائج التجريبية على مجموعة بيانات TelDrone الصعبة إلى أن النهج المقترح يمكنه تجاوز أفضل الأساليب الحالية ضمن نطاق واسع من قيم العتبة للخرائط المنتجة. كما قمنا بحساب النتائج على مجموعة بيانات CUB، مما يظهر أن طريقتنا يمكن تكييفها لأغراض أخرى.