Auswirkungsbewertung fehlender Daten in Modellvorhersagen für Erdbeobachtungsanwendungen

Anwendungen der Erdbeobachtung (EO), die komplexe und heterogene Datenquellen umfassen, werden häufig mit maschinellen Lernmodellen angegangen. Es wird jedoch allgemein angenommen, dass diese Datenquellen dauerhaft verfügbar sein werden. Verschiedene Situationen können die Verfügbarkeit von EO-Quellen beeinträchtigen, wie zum Beispiel Rauschen, Wolken oder Ausfälle von Satellitenmissionen. In dieser Arbeit bewerten wir den Einfluss fehlender zeitlicher und statischer EO-Quellen auf trainierte Modelle anhand von vier Datensätzen mit Klassifikations- und Regressionsaufgaben. Wir vergleichen die Vorhersagegüte verschiedener Methoden und stellen fest, dass einige natürlicher robust gegenüber fehlenden Daten sind. Insbesondere erreicht die Ensemble-Strategie eine Vorhersagerobustheit von bis zu 100 %. Wir zeigen auf, dass fehlende Szenarien in Regressionsaufgaben erheblich schwieriger sind als in Klassifikationsaufgaben. Schließlich finden wir heraus, dass der optische Blick (optical view) bei individuellem Fehlen die kritischste Ansicht ist.