HyperAIHyperAI

Command Palette

Search for a command to run...

Formation d'images par des transformateurs efficaces en données d'entraînement et distillation par l'attention

Hugo Touvron Matthieu Cord Matthijs Douze Francisco Massa Alexandre Sablayrolles Hervé Jégou

Résumé

Récemment, des réseaux neuronaux purement basés sur l'attention ont été montrés capables de traiter des tâches de compréhension d'images, telles que la classification d'images. Cependant, ces transformateurs visuels sont pré-entraînés avec des centaines de millions d'images en utilisant une infrastructure coûteuse, ce qui limite leur adoption.Dans cette étude, nous produisons un transformateur compétitif et exempt de convolution en ne l'entraînant que sur ImageNet. Nous les entraînons sur un seul ordinateur en moins de 3 jours. Notre transformateur de référence (86 millions de paramètres) atteint une précision top-1 de 83,1 % (évaluation à partir d'un seul découpage) sur ImageNet sans données externes.Plus important encore, nous introduisons une stratégie spécifique aux transformateurs basée sur le principe du maître-étudiant. Elle repose sur un jeton de distillation garantissant que l'étudiant apprend auprès du maître par le biais de l'attention. Nous démontrons l'intérêt de cette distillation basée sur des jetons, particulièrement lorsqu'un convnet est utilisé comme maître. Cela nous permet d'obtenir des résultats compétitifs avec les convnets tant pour ImageNet (où nous atteignons jusqu'à 85,2 % de précision) que lors du transfert à d'autres tâches. Nous partageons notre code et nos modèles.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp