HyperAIHyperAI
il y a 17 jours

Le jeu de données MAMe : Sur la pertinence des propriétés d’images à haute résolution et à forme variable

Ferran Parés, Anna Arias-Duart, Dario Garcia-Gasulla, Gema Campo-Francés, Nina Viladrich, Eduard Ayguadé, Jesús Labarta
Le jeu de données MAMe : Sur la pertinence des propriétés d’images à haute résolution et à forme variable
Résumé

Dans la tâche de classification d’images, l’approche la plus courante consiste à redimensionner toutes les images d’un jeu de données à une forme unique, tout en réduisant leur précision à une taille permettant d’expérimenter à grande échelle. Cette pratique présente des avantages du point de vue computationnel, mais entraîne des effets néfastes sur les performances en raison de la perte d’information et de la déformation des images. Dans ce travail, nous introduisons le jeu de données MAMe, un ensemble de classification d’images caractérisé par une résolution exceptionnellement élevée et des dimensions variables. L’objectif de MAMe est de fournir un outil pour étudier l’impact de ces propriétés sur la classification d’images, tout en stimulant la recherche dans ce domaine. Le jeu de données MAMe comprend des milliers d’œuvres provenant de trois musées différents, et propose une tâche de classification visant à distinguer 29 supports (c’est-à-dire matériaux et techniques), supervisée par des experts en art. Après avoir examiné la singularité de MAMe dans le contexte des tâches actuelles de classification d’images, nous fournissons une description détaillée de la tâche ainsi que des statistiques sur le jeu de données. Des expériences sont menées afin d’évaluer l’impact de l’utilisation d’images à haute résolution, d’entrées à forme variable, ainsi que des deux propriétés combinées. Les résultats mettent en évidence un effet positif sur les performances lorsque l’on utilise des images à haute résolution, tout en soulignant le manque de solutions efficaces pour exploiter les formes variables. Une expérience supplémentaire met en évidence la spécificité de MAMe par rapport au jeu de données prototype ImageNet. Enfin, les modèles de base sont analysés à l’aide de méthodes d’explicabilité et de connaissances d’experts afin d’obtenir des insights sur les défis encore à relever.