HyperAIHyperAI
vor 17 Tagen

U-Net-Ensemble zur Verbesserung der semantischen Segmentierung in Fernerkundungsbildern

{Ivan Kitanovski, Suzana Loshkovska, Vlatko Spasev, Ivica Dimitrovski}
Abstract

Die semantische Segmentierung von Fernerkundungsbildern stellt eine zentrale Aufgabe sowohl im Bereich der Fernerkundung als auch der Computer Vision dar. Ihr Ziel besteht darin, eine umfassende pixelweise Segmentierungskarte eines Bildes zu erzeugen, indem jedem Pixel ein spezifischer Label zugewiesen wird. Dies ermöglicht eine detaillierte Analyse und Interpretation der Erdoberfläche. In diesem Artikel präsentieren wir einen Ansatz zur Verbesserung der Leistungsfähigkeit der semantischen Segmentierung durch den Einsatz eines Ensembles von U-Net-Modellen mit drei unterschiedlichen Backbone-Netzwerken: Multi-Axis Vision Transformer, ConvFormer und EfficientNet. Die endgültigen Segmentierungskarten werden mittels einer geometrischen Mittelwert-Ensemble-Methode generiert, wobei die unterschiedlichen, von den einzelnen Backbone-Netzwerken gelernten Darstellungen effektiv genutzt werden. Die Wirksamkeit der Basis-U-Net-Modelle sowie des vorgeschlagenen Ensembles wird an mehreren Datensätzen evaluiert, die üblicherweise für semantische Segmentierungsaufgaben in Fernerkundungsbildern verwendet werden, darunter LandCover.ai, LoveDA, INRIA, UAVid und ISPRS Potsdam. Unsere experimentellen Ergebnisse zeigen, dass der vorgeschlagene Ansatz eine state-of-the-art-Leistung erreicht und somit seine Effektivität und Robustheit bei der präzisen Erfassung semantischer Informationen in Fernerkundungsbildern unter Beweis stellt.

U-Net-Ensemble zur Verbesserung der semantischen Segmentierung in Fernerkundungsbildern | Neueste Forschungsarbeiten | HyperAI