Évaluation de l'impact des données manquantes dans les prédictions de modèles pour les applications d'observation de la Terre

Les applications d'observation terrestre (EO) impliquant des sources de données complexes et hétérogènes sont généralement abordées à l'aide de modèles d'apprentissage automatique. Cependant, il existe une hypothèse courante selon laquelle ces sources de données seront toujours disponibles. Différentes situations peuvent affecter la disponibilité des sources EO, telles que le bruit, les nuages ou les échecs de missions satellites. Dans cette étude, nous évaluons l'impact de l'absence de sources EO temporelles et statiques sur des modèles entraînés à partir de quatre ensembles de données comprenant des tâches de classification et de régression. Nous comparons la qualité prédictive de différentes méthodes et constatons que certaines sont naturellement plus robustes face aux données manquantes. La stratégie d'Ensemble, en particulier, atteint une robustesse prédictive jusqu'à 100%. Nous démontrons que les scénarios avec des données manquantes sont nettement plus difficiles pour les tâches de régression que pour celles de classification. Enfin, nous trouvons que la vue optique est la plus critique lorsqu'elle est absente individuellement.