HyperAIHyperAI
il y a 18 jours

Une étude complète sur les modèles pré-entraînés Torchvision pour la classification fine entre espèces

Feras Albardi, H M Dipu Kabir, Md Mahbub Islam Bhuiyan, Parham M. Kebria, Abbas Khosravi, Saeid Nahavandi
Une étude complète sur les modèles pré-entraînés Torchvision pour la classification fine entre espèces
Résumé

Cette étude vise à explorer les différents modèles pré-entraînés proposés dans le package Torchvision, disponible dans la bibliothèque PyTorch, et à évaluer leur efficacité dans la classification d'images à très fine granularité. Le transfert d'apprentissage (Transfer Learning) constitue une méthode efficace permettant d'obtenir de très bons résultats même en présence de données d'entraînement limitées. Dans de nombreuses situations réelles, il est difficile de collecter un volume suffisant de données pour entraîner efficacement un modèle de réseau de neurones profond. Les modèles de transfert d'apprentissage sont pré-entraînés sur de grands jeux de données et permettent d'obtenir de bonnes performances sur des jeux de données plus petits, avec un temps d'entraînement significativement réduit. Le package Torchvision met à disposition plusieurs modèles permettant d'appliquer le transfert d'apprentissage sur des jeux de données de petite taille. Par conséquent, les chercheurs pourraient bénéficier d'une orientation claire pour sélectionner un modèle approprié. Nous avons évalué les modèles pré-entraînés de Torchvision sur quatre jeux de données différents : 10 Monkey Species, 225 Bird Species, Fruits 360 et Oxford 102 Flowers. Ces jeux de données présentent des images de résolutions variées, un nombre de classes différent et des taux d'exactitude atteignables hétérogènes. Nous avons également appliqué, pour chaque modèle, la couche entièrement connectée classique ainsi que la couche entièrement connectée Spinal, afin d’évaluer l’efficacité de SpinalNet. Les résultats montrent que la couche entièrement connectée Spinal améliore les performances dans la plupart des cas. Pour assurer une comparaison équitable entre les modèles, nous avons utilisé les mêmes techniques d’augmentation des données pour tous les modèles sur un même jeu de données. Ce travail peut guider les chercheurs futurs en vision par ordinateur dans le choix d’un modèle de transfert d’apprentissage adapté.

Une étude complète sur les modèles pré-entraînés Torchvision pour la classification fine entre espèces | Articles de recherche récents | HyperAI