HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage métadifférentiel basé sur le gradient avec métrique intercalaire apprise et sous-espace

Yoonho Lee Seungjin Choi

Résumé

Les méthodes de méta-apprentissage basées sur les gradients exploitent la descente de gradient pour apprendre les similarités entre différentes tâches. Bien que ces méthodes aient été couronnées de succès dans le domaine du méta-apprentissage, elles se contentaient jusqu'à présent d'une descente de gradient simple lors des tests de méta-apprentissage. Notre contribution principale est l'introduction du {\em MT-net}, qui permet au méta-apprenant d'apprendre un sous-espace dans l'espace d'activation de chaque couche, sur lequel le apprenant spécifique à la tâche effectue la descente de gradient. De plus, un apprenant spécifique à la tâche dans un {\em MT-net} effectue une descente de gradient par rapport à une métrique de distance méta-apprise, ce qui déforme l'espace d'activation pour qu'il soit plus sensible à l'identité de la tâche. Nous montrons que la dimension de cet espace sous-appris reflète la complexité de la tâche d'adaptation spécifique à la tâche, et également que notre modèle est moins sensible au choix des taux d'apprentissage initiaux comparé aux méthodes précédentes de méta-apprentissage basées sur les gradients. Notre méthode atteint des performances équivalentes ou supérieures à l'état de l'art pour les tâches de classification et de régression avec peu d'exemples.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Apprentissage métadifférentiel basé sur le gradient avec métrique intercalaire apprise et sous-espace | Articles | HyperAI