HyperAIHyperAI
il y a 2 mois

Fongiques danois 2020 -- Pas seulement un autre ensemble de données de reconnaissance d'images

Picek, Lukáš ; Šulc, Milan ; Matas, Jiří ; Heilmann-Clausen, Jacob ; Jeppesen, Thomas S. ; Læssøe, Thomas ; Frøslev, Tobias
Fongiques danois 2020 -- Pas seulement un autre ensemble de données de reconnaissance d'images
Résumé

Nous présentons un nouveau jeu de données et une nouvelle référence de granularité fine, les Champignons danois 2020 (DF20). Ce jeu de données, construit à partir d'observations soumises à l'Atlas des champignons danois, est unique par ses étiquettes de classe taxonomiquement précises, son faible nombre d'erreurs, sa distribution de classes très déséquilibrée et à queue longue, ses métadonnées d'observation riches, et sa hiérarchie de classes bien définie. DF20 n'a aucun chevauchement avec ImageNet, permettant ainsi des comparaisons non biaisées des modèles affinés à partir de points de contrôle ImageNet publiquement disponibles. Le protocole d'évaluation proposé permet de tester la capacité d'améliorer la classification en utilisant des métadonnées -- par exemple, la localisation géographique précise, le biotope et le substrat -- facilite les tests d'étalonnage du classifieur, et enfin permet d'étudier l'impact des paramètres du dispositif sur les performances de classification. Des expériences utilisant des Réseaux Neuronaux Convolutifs (CNN) et les récents Transformers Visuels (ViT) montrent que DF20 représente une tâche difficile. De manière intéressante, ViT obtient des résultats supérieurs aux CNN basiques avec une précision de 80,45 % et un score macro F1 de 0,743, réduisant respectivement l'erreur des CNN de 9 % et 12 %. Une procédure simple pour intégrer les métadonnées dans le processus décisionnel améliore la précision de classification de plus de 2,95 points pourcentage, réduisant le taux d'erreur de 15 %. Le code source pour toutes les méthodes et expériences est disponible à l'adresse https://sites.google.com/view/danish-fungi-dataset.