HyperAIHyperAI
il y a 17 jours

Astroformer : Plus de données ne sont peut-être pas tout ce dont vous avez besoin pour la classification

Rishit Dagli
Astroformer : Plus de données ne sont peut-être pas tout ce dont vous avez besoin pour la classification
Résumé

Les avancées récentes dans des domaines tels que le traitement du langage naturel et la vision par ordinateur reposent sur des modèles complexes et massifs, entraînés à l’aide d’énormes quantités de données non étiquetées ou partiellement étiquetées. Le déploiement ou l’entraînement de ces méthodes de pointe dans des environnements à ressources limitées constitue toutefois un défi majeur. La morphologie des galaxies joue un rôle fondamental dans la compréhension des processus de formation et d’évolution des galaxies. Des méthodes efficaces de classification de ces morphologies sont nécessaires pour extraire des informations physiques à partir des grandes enquêtes astronomiques modernes. Dans cet article, nous présentons Astroformer, une méthode conçue pour apprendre à partir de quantités réduites de données. Nous proposons une architecture hybride transformer-convolutionnelle, fortement inspirée du succès de CoAtNet et de MaxViT. Plus précisément, nous utilisons une architecture hybride transformer-convolutionnelle intégrant une nouvelle conception de pile pour le réseau, une approche originale pour la construction d’une couche d’attention relative, ainsi qu’une sélection soigneuse de techniques d’augmentation de données et de régularisation. Notre approche établit un nouveau record sur la prédiction des morphologies galactiques à partir d’images sur le jeu de données Galaxy10 DECals, un objectif scientifique composé de 17 736 images étiquetées, atteignant une précision top-1 de 94,86 %, surpassant ainsi l’état de l’art actuel pour cette tâche de 4,62 %. En outre, cette méthode établit également un nouveau record sur CIFAR-100 et Tiny ImageNet. Nous observons également que les modèles et méthodes d’entraînement conçus pour des jeux de données volumineux ne fonctionnent souvent pas efficacement dans le régime à faible quantité de données.