HyperAIHyperAI

Command Palette

Search for a command to run...

CURL : Représentations non supervisées contrastives pour l'apprentissage par renforcement

Aravind Srinivas Michael Laskin Pieter Abbeel

Résumé

Nous présentons CURL : Representations contrastives non supervisées pour l’apprentissage par renforcement. CURL extrait des caractéristiques de haut niveau à partir de pixels bruts en utilisant l’apprentissage contrastif, puis effectue un contrôle hors politique (off-policy) sur les caractéristiques ainsi extraites. CURL surpasse les méthodes précédentes basées sur les pixels, qu’elles soient basées sur un modèle ou sans modèle, sur des tâches complexes du DeepMind Control Suite et des jeux Atari, avec des gains de performance respectifs de 1,9× et 1,2× aux seuils de 100 000 étapes d’environnement et d’interactions. Sur le DeepMind Control Suite, CURL est la première méthode basée sur des images à approcher presque la performance en efficacité d’échantillonnage des méthodes utilisant des caractéristiques d’état. Notre code est open source et disponible à l’adresse suivante : https://github.com/MishaLaskin/curl.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp