HyperAIHyperAI
منذ 17 أيام

تجميع U-Net لتحسين التجزئة الدلالية في الصور المستشعرة عن بعد

{Ivan Kitanovski, Suzana Loshkovska, Vlatko Spasev, Ivica Dimitrovski}
الملخص

يُعد التجزئة الدلالية للصور المستشعرة عن بعد مهمة أساسية ضمن مجالات الاستشعار عن بعد ورؤية الحاسوب. ويهدف هذا المفهوم إلى إنتاج خريطة تجزئة شمولية على مستوى البكسل لكل صورة، بحيث يتم تعيين تسمية محددة لكل بكسل، مما يُمكّن من تحليل وتفسير متعمق لسطح الأرض. في هذا البحث، نقترح نهجًا لتحسين أداء التجزئة الدلالية من خلال استخدام مجموعة من نماذج U-Net ذات ثلاثة شبكات أساسية مختلفة: متعدد المحاور (Multi-Axis Vision Transformer)، وConvFormer، وEfficientNet. يتم إنشاء الخرائط النهائية للتجزئة باستخدام طريقة تجميع المتوسط الهندسي، مع الاستفادة من التمثيلات المتنوعة التي تتعلمها كل شبكة أساسية. وقد تم تقييم كفاءة نماذج U-Net الأساسية والطريقة المقترحة على عدة مجموعات بيانات شائعة الاستخدام في مهام التجزئة الدلالية للصور المستشعرة عن بعد، بما في ذلك مجموعات بيانات LandCover.ai وLoveDA وINRIA وUAVid وISPRS Potsdam. تُظهر النتائج التجريبية أن النهج المقترح يحقق أداءً من الدرجة الأولى (state-of-the-art)، مما يُبرز فعاليته وقوته في التقاط المعلومات الدلالية بدقة ضمن الصور المستشعرة عن بعد.