HyperAIHyperAI

Command Palette

Search for a command to run...

Modèle Souping

Date

il y a 6 heures

Organisation

Google
Université de Washington

URL du document

2203.05482

Le modèle Souping a été proposé conjointement en juillet 2022 par une équipe de recherche de l'Université de Washington, de Google et d'autres universités et institutions. Les résultats de cette recherche ont été publiés dans l'article « ... ».Modèles composites : la moyenne des poids de plusieurs modèles affinés améliore la précision sans augmenter le temps d’inférence.", sélectionné pour ICML 2022.

Le Model Souping consiste à moyenner les poids de plusieurs modèles affinés indépendamment afin d'améliorer la précision et la robustesse du modèle. Ce paradigme effectue une moyenne pondérée uniquement sur les modèles affinés après l'optimisation des hyperparamètres, sans nécessiter d'entraînement supplémentaire ni augmenter les coûts de calcul lors de l'inférence. Lors de l'affinage de grands modèles pré-entraînés tels que ViT-G pré-entraîné avec CLIP, ALIGN et JFT, la méthode Model Souping améliore significativement le meilleur modèle individuel obtenu par optimisation des hyperparamètres sur ImageNet. Le modèle ViT-G résultant a atteint une précision de 90,941 TP3T sur ImageNet, établissant ainsi une nouvelle référence technique. De plus, cette méthode peut être étendue à diverses tâches de classification d'images et de traitement automatique du langage naturel, améliorant non seulement les performances de généralisation hors distribution, mais aussi les capacités d'apprentissage zéro-shot dans de nouvelles tâches en aval.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp