Date

il y a 3 mois

Organisation

URL du document

Balises

Le modèle Souping a été proposé conjointement en juillet 2022 par une équipe de recherche de l'Université de Washington, de Google et d'autres universités et institutions. Les résultats de cette recherche ont été publiés dans l'article « ... ».Modèles composites : la moyenne des poids de plusieurs modèles affinés améliore la précision sans augmenter le temps d’inférence.", sélectionné pour ICML 2022.

Le Model Souping consiste à moyenner les poids de plusieurs modèles affinés indépendamment afin d'améliorer la précision et la robustesse du modèle. Ce paradigme effectue une moyenne pondérée uniquement sur les modèles affinés après l'optimisation des hyperparamètres, sans nécessiter d'entraînement supplémentaire ni augmenter les coûts de calcul lors de l'inférence. Lors de l'affinage de grands modèles pré-entraînés tels que ViT-G pré-entraîné avec CLIP, ALIGN et JFT, la méthode Model Souping améliore significativement le meilleur modèle individuel obtenu par optimisation des hyperparamètres sur ImageNet. Le modèle ViT-G résultant a atteint une précision de 90,941 TP3T sur ImageNet, établissant ainsi une nouvelle référence technique. De plus, cette méthode peut être étendue à diverses tâches de classification d'images et de traitement automatique du langage naturel, améliorant non seulement les performances de généralisation hors distribution, mais aussi les capacités d'apprentissage zéro-shot dans de nouvelles tâches en aval.

Associé Wiki

Modèle d'action Mondial WAM

WAM est une nouvelle architecture de modèle fondamental d'IA pour les domaines de l'intelligence incarnée et de la robotique.

il y a 2 mois

Renforcement De La Pensée Guidée

GTR peut guider le raisonnement du modèle dans des environnements visuels complexes et prévenir la « panne cérébrale ».

il y a 3 mois

Découpage Gourmand À Rendement Maximal

PRGS améliore considérablement la capacité des modèles d'apprentissage par renforcement hors ligne à combiner des expériences à forte récompense.

il y a 3 mois

Apprendre En Déployant

LWD est un cadre d'apprentissage par renforcement hors ligne à en ligne au niveau de la flotte qui permet aux robots à usage général de collecter en continu de l'expérience et de réaliser une auto-évolution des politiques.

il y a 2 mois

Théorie De l'espace

La théorie spatiale désigne le cadre conceptuel permettant à un agent intelligent de construire, de mettre à jour et d'utiliser des représentations spatiales dans un environnement d'informations incomplètes grâce à une exploration active.

il y a 3 mois

Retriever Dense

Le moteur de recherche dense est chargé de trouver rapidement, au sein d'une vaste bibliothèque de documents, les paragraphes les plus pertinents par rapport à la sémantique de la requête ; il constitue le composant fondamental du système de génération d'amélioration de la recherche.

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Date

il y a 3 mois

Organisation

URL du document

2203.05482

Balises

Apprentissage Automatique

Associé Wiki

Modèle d'action Mondial WAM

WAM est une nouvelle architecture de modèle fondamental d'IA pour les domaines de l'intelligence incarnée et de la robotique.

il y a 2 mois

Renforcement De La Pensée Guidée

GTR peut guider le raisonnement du modèle dans des environnements visuels complexes et prévenir la « panne cérébrale ».

il y a 3 mois

Découpage Gourmand À Rendement Maximal

PRGS améliore considérablement la capacité des modèles d'apprentissage par renforcement hors ligne à combiner des expériences à forte récompense.

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Modèle Souping

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Modèle Souping

Associé Wiki

Modèle d'action Mondial WAM

Renforcement De La Pensée Guidée

Découpage Gourmand À Rendement Maximal

Apprendre En Déployant

Théorie De l'espace

Retriever Dense

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Modèle Souping

Associé Wiki

Modèle d'action Mondial WAM

Renforcement De La Pensée Guidée

Découpage Gourmand À Rendement Maximal

Apprendre En Déployant

Théorie De l'espace

Retriever Dense

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Wiki

Modèle d'action Mondial WAM

Renforcement De La Pensée Guidée

Découpage Gourmand À Rendement Maximal

Apprendre En Déployant

Théorie De l'espace

Retriever Dense

Associé Wiki

Modèle d'action Mondial WAM

Renforcement De La Pensée Guidée

Découpage Gourmand À Rendement Maximal

Apprendre En Déployant

Théorie De l'espace

Retriever Dense