HyperAIHyperAI

Command Palette

Search for a command to run...

Exploration Profonde par DQN Bootstrapée

Ian Osband Charles Blundell Alexander Pritzel Benjamin Van Roy

Résumé

L'exploration efficace dans des environnements complexes reste un défi majeur pour l'apprentissage par renforcement. Nous proposons le bootstrapped DQN, un algorithme simple qui explore de manière computationnellement et statistiquement efficace grâce à l'utilisation de fonctions de valeur randomisées. Contrairement aux stratégies de perturbation comme l'exploration epsilon-greedy, le bootstrapped DQN réalise une exploration temporairement prolongée (ou profonde) ; cela peut conduire à un apprentissage exponentiellement plus rapide. Nous démontrons ces avantages dans des MDP stochastiques complexes et dans l'environnement d'apprentissage d'arcade à grande échelle. Le bootstrapped DQN améliore considérablement les temps d'apprentissage et les performances dans la plupart des jeux Atari.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Exploration Profonde par DQN Bootstrapée | Articles | HyperAI