il y a 8 mois

Résumé

Nous présentons Token Merging (ToMe), une méthode simple pour augmenter le débit des modèles ViT existants sans nécessité de formation supplémentaire. ToMe combine progressivement des jetons similaires dans un transformateur en utilisant un algorithme de correspondance général et léger qui est aussi rapide que l'élagage tout en étant plus précis. En version standard, ToMe peut doubler le débit des modèles ViT-L @ 512 et ViT-H @ 518 sur les images, et augmenter le débit du modèle ViT-L sur les vidéos de 2,2 fois, avec une baisse d'exactitude n'excédant pas 0,2 à 0,3 % dans chaque cas. ToMe peut également être facilement appliqué pendant la formation, améliorant en pratique la vitesse de formation jusqu'à deux fois pour le fine-tuning MAE sur vidéo. La formation avec ToMe réduit davantage la baisse d'exactitude, permettant ainsi au modèle ViT-B d'atteindre un débit double sur l'audio pour une seule perte de mAP de 0,4 %. Qualitativement, nous constatons que ToMe fusionne les parties d'un objet en un seul jeton, même sur plusieurs cadres vidéo. Dans l'ensemble, l'exactitude et la vitesse de ToMe sont compétitives avec l'état de l'art sur les images, les vidéos et l'audio.

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 8 mois

Vision Par Ordinateur

Tâche

Daniel Bolya Cheng-Yang Fu Xiaoliang Dai Peizhao Zhang Christoph Feichtenhofer Judy Hoffman

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 8 mois

Vision Par Ordinateur

Tâche

Daniel Bolya Cheng-Yang Fu Xiaoliang Dai Peizhao Zhang Christoph Feichtenhofer Judy Hoffman

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Fusion de Tokens : Votre ViT Plus Rapide | Articles | HyperAI

Command Palette

Fusion de Tokens : Votre ViT Plus Rapide

Daniel Bolya Cheng-Yang Fu Xiaoliang Dai Peizhao Zhang Christoph Feichtenhofer Judy Hoffman

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Fusion de Tokens : Votre ViT Plus Rapide

Daniel Bolya Cheng-Yang Fu Xiaoliang Dai Peizhao Zhang Christoph Feichtenhofer Judy Hoffman

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Fusion de Tokens : Votre ViT Plus Rapide

Daniel Bolya Cheng-Yang Fu Xiaoliang Dai Peizhao Zhang Christoph Feichtenhofer Judy Hoffman

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters