HyperAIHyperAI
منذ 16 أيام

توسيع التماثل بين الرؤى العالمية والمكانية للتعلم ذاتي التوجيه باستخدام الصور الاستشعار عن بعد

Xinye Wanyan, Sachith Seneviratne, Shuchang Shen, Michael Kirley
توسيع التماثل بين الرؤى العالمية والمكانية للتعلم ذاتي التوجيه باستخدام الصور الاستشعار عن بعد
الملخص

نظرًا لتوفر عدد كبير من صور الاستشعار عن بعد عالية الجودة بسهولة، أصبح استغلال مجموعة صور ضخمة تتطلب تسمية يدوية أقل موضوعًا يحظى باهتمام متزايد. تُكتسب النماذج ذاتية التدريب تمثيلات مميزة عامة من خلال صياغة مهمة وهمية (pretext task) تُولّد تسميات افتراضية (pseudo-labels) للبيانات غير المُسمّاة بكميات ضخمة، بهدف توفير إشراف لتدريب النموذج. وعلى الرغم من أن الدراسات السابقة استكشفت عدة تقنيات للتعلم ذاتي التدريب في مجال الاستشعار عن بعد، إلا أن المهام الوهمية القائمة على محاذاة الرؤية المحلية والعالمية ما زالت غير مكتملة الاستكشاف، رغم تحقيقها نتائج متفوقة على الصور الطبيعية. مستلهمين من نموذج DINO، الذي يعتمد على هيكل فعّال لتعلم التمثيلات باستخدام تقنية التعلم المنقولة (knowledge distillation) بناءً على محاذاة الرؤية المحلية والعالمية، قمنا بصياغة مهمتين وهميتين لتعلم ذاتي التدريب في صور الاستشعار عن بعد (SSLRS). وباستخدام هاتين المهمتين، نستكشف فعالية التباين الإيجابي الزمني (positive temporal contrast) وكذلك استخدام رؤى متعددة الأحجام في SSLRS. ونُعدّل نموذج DINO ونُقدّم DINO-MC، الذي يستخدم رؤى محلية ذات أحجام مختلفة للقطع (crops) بدلًا من حجم ثابت واحد، بهدف تقليل التباين المحدود في أحجام الكائنات الملاحظة في صور الاستشعار عن بعد. تُظهر تجاربنا أن DINO-MC، حتى عند تدريبه على 10% فقط من مجموعة البيانات، يُحقق أداءً مساويًا أو أفضل من الطرق الحالية الأفضل في مجال SSLRS على عدة مهام في الاستشعار عن بعد، مع استخدام موارد حوسبة أقل. تم إتاحة جميع الأكواد والنماذج والنتائج عبر الرابط: https://github.com/WennyXY/DINO-MC.

توسيع التماثل بين الرؤى العالمية والمكانية للتعلم ذاتي التوجيه باستخدام الصور الاستشعار عن بعد | أحدث الأوراق البحثية | HyperAI