HyperAIHyperAI
il y a 2 mois

Le Jeu de Données d'Classification et de Détection d'Espèces iNaturalist

Grant Van Horn; Oisin Mac Aodha; Yang Song; Yin Cui; Chen Sun; Alex Shepard; Hartwig Adam; Pietro Perona; Serge Belongie
Le Jeu de Données d'Classification et de Détection d'Espèces iNaturalist
Résumé

Les jeux de données d'images existants utilisés en vision par ordinateur ont tendance à présenter une distribution uniforme des images entre les catégories d'objets. En revanche, le monde naturel est fortement déséquilibré, certains espèces étant plus abondantes et plus faciles à photographier que d'autres. Pour encourager des progrès supplémentaires dans des conditions réelles difficiles, nous présentons le jeu de données iNaturalist pour la classification et la détection d'espèces, composé de 859 000 images provenant de plus de 5 000 espèces différentes de plantes et d'animaux. Ce jeu de données met en avant des espèces visuellement similaires, capturées dans une grande variété de situations à travers le monde. Les images ont été collectées avec différents types d'appareils photo, présentent une qualité variable, comportent un fort déséquilibre entre les classes et ont été vérifiées par plusieurs citoyens scientifiques. Nous discutons du processus de collecte du jeu de données et présentons des expériences baselines exhaustives utilisant des modèles de classification et de détection en vision par ordinateur d'avant-garde. Les résultats montrent que les méthodes actuelles non basées sur l'agrégation n'atteignent qu'une précision de classification en tête unique de 67 %, illustrant ainsi la difficulté du jeu de données. Plus précisément, nous observons des performances médiocres pour les classes ayant peu d'exemples d'apprentissage, suggérant qu'il faut accorder davantage d'attention à l'apprentissage faiblement supervisé (low-shot learning).

Le Jeu de Données d'Classification et de Détection d'Espèces iNaturalist | Articles de recherche récents | HyperAI