HyperAIHyperAI
il y a 11 jours

La pré-formation sur ImageNet est-elle encore nécessaire pour la classification des scènes en télédétection ?

Vladimir Risojević, Vladan Stojnić
La pré-formation sur ImageNet est-elle encore nécessaire pour la classification des scènes en télédétection ?
Résumé

En raison de la rareté des données étiquetées, l’utilisation de modèles supervisés pré-entraînés sur ImageNet constitue actuellement la norme de facto dans la classification des scènes en télédétection. Récemment, la disponibilité de jeux de données plus volumineux d’images à haute résolution en télédétection (HRRS) ainsi que les progrès réalisés dans l’apprentissage auto-supervisé ont soulevé la question de savoir si l’entraînement préalable supervisé sur ImageNet reste nécessaire pour la classification des scènes en télédétection, et si un entraînement préalable supervisé sur des jeux de données HRRS ou un entraînement auto-supervisé sur ImageNet permettrait d’obtenir de meilleurs résultats sur les tâches cibles de classification des scènes en télédétection. Pour répondre à ces questions, dans cet article, nous entraînons des modèles à partir de zéro, ainsi que des modèles pré-entraînés de manière supervisée et auto-supervisée sur ImageNet, que nous ajustons finement sur plusieurs jeux de données d’images HRRS. Nous évaluons également la transférabilité des représentations apprises vers des tâches de classification des scènes en télédétection HRRS, et montrons que l’entraînement auto-supervisé surpasse l’entraînement supervisé, tandis que les performances de l’entraînement préalable sur des données HRRS sont comparables à celles de l’entraînement auto-supervisé ou légèrement inférieures. Enfin, nous proposons d’utiliser un modèle pré-entraîné sur ImageNet, suivi d’un deuxième tour d’entraînement préalable sur des images HRRS du domaine cible, c’est-à-dire un entraînement préalable adaptatif au domaine. Les résultats expérimentaux montrent que cet entraînement préalable adaptatif au domaine conduit à des modèles atteignant des performances de pointe sur les benchmarks de classification des scènes en télédétection HRRS. Le code source et les modèles pré-entraînés sont disponibles à l’adresse suivante : \url{https://github.com/risojevicv/RSSC-transfer}.

La pré-formation sur ImageNet est-elle encore nécessaire pour la classification des scènes en télédétection ? | Articles de recherche récents | HyperAI