HyperAIHyperAI
il y a 2 mois

Apprentissage métadontique agnostique au modèle pour une adaptation rapide des réseaux profonds

Finn, Chelsea ; Abbeel, Pieter ; Levine, Sergey
Apprentissage métadontique agnostique au modèle pour une adaptation rapide des réseaux profonds
Résumé

Nous proposons un algorithme de méta-apprentissage qui est agnostique envers le modèle, dans le sens où il est compatible avec tout modèle formé par descente de gradient et applicable à une variété de problèmes d'apprentissage différents, tels que la classification, la régression et l'apprentissage par renforcement. L'objectif du méta-apprentissage est de former un modèle sur une multitude de tâches d'apprentissage afin qu'il puisse résoudre de nouvelles tâches d'apprentissage en utilisant seulement un petit nombre d'échantillons d'entraînement. Dans notre approche, les paramètres du modèle sont explicitement formés de manière à ce qu'un petit nombre d'étapes de gradient avec une petite quantité de données d'entraînement provenant d'une nouvelle tâche produise une bonne performance généralisée sur cette tâche. En effet, notre méthode forme le modèle pour qu'il soit facile à affiner. Nous démontrons que cette approche conduit à des performances de pointe sur deux benchmarks de classification d'images en apprentissage faible (few-shot), produit des résultats satisfaisants en régression faible (few-shot) et accélère l'affinage pour l'apprentissage par renforcement basé sur les gradients de politique avec des politiques neuronales.