Lokalitätsbewusste hyperspektrale Klassifikation

Die Klassifikation hyperspektraler Bilder gewinnt zunehmend an Bedeutung für hochpräzise Anwendungen im Bereich der Fernerkundung, da sie die Fähigkeit besitzen, visuelle Informationen über einen weiten Kontinuum von Spektralbändern zu erfassen. Forscher arbeiten seit langem daran, die Klassifikation hyperspektraler Bilder zu automatisieren, wobei in jüngster Zeit Vision-Transformers eingesetzt werden. Allerdings berücksichtigen die meisten bestehenden Modelle ausschließlich spektrale Informationen und achten wenig auf räumliche Lokalität (d. h. benachbarte Pixel), was zu einer unzureichenden Trennschärfe führen kann und somit die Leistung begrenzt. Um dieses Problem anzugehen, präsentieren wir drei zentrale Beiträge: i) Wir stellen den Hyperspectral Locality-aware Image TransformEr (HyLITE) vor, einen Vision-Transformer, der sowohl lokale als auch spektrale Informationen modelliert; ii) eine neuartige Regularisierungsfunktion, die die Integration lokaler als auch globaler Informationen fördert; und iii) unser vorgeschlagenes Verfahren erreicht signifikant höhere Genauigkeitswerte im Vergleich zu bestehenden Baselines, wobei bis zu 10 %ige Verbesserungen erzielt werden. Die trainierten Modelle sowie der Quellcode sind unter HyLITE verfügbar.