HyperAIHyperAI

Command Palette

Search for a command to run...

Hiera : Un Transformers visuel hiérarchique sans les fioritures

Résumé

Les transformateurs visuels hiérarchiques modernes ont ajouté plusieurs composants spécifiques à la vision dans le but d'améliorer les performances de classification supervisée. Bien que ces composants conduisent à des précisions efficaces et à des comptages de FLOP attractifs, la complexité supplémentaire rend en réalité ces transformateurs plus lents que leurs homologues ViT basiques. Dans cet article, nous soutenons que cette masse supplémentaire est inutile. En préformant avec une tâche visuelle prétexte robuste (MAE), nous pouvons éliminer toutes les fonctionnalités superflues d'un transformateur visuel multistage de pointe sans perdre en précision. Au cours de ce processus, nous avons créé Hiera, un transformateur visuel hiérarchique extrêmement simple qui est plus précis que les modèles précédents tout en étant considérablement plus rapide, tant lors de l'inférence que pendant l'entraînement. Nous évaluons Hiera sur une variété de tâches de reconnaissance d'images et de vidéos. Notre code et nos modèles sont disponibles à l'adresse suivante : https://github.com/facebookresearch/hiera.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp