HyperAIHyperAI

Command Palette

Search for a command to run...

Méthodes Massivement Parallèles pour l'Apprentissage par Renforcement Profond

Résumé

Nous présentons la première architecture massivement distribuée pour l'apprentissage par renforcement profond. Cette architecture utilise quatre composants principaux : des acteurs parallèles qui génèrent un nouveau comportement ; des apprenants parallèles qui sont formés à partir d'expériences stockées ; un réseau neuronal distribué pour représenter la fonction de valeur ou la politique de comportement ; et un magasin distribué d'expériences. Nous avons utilisé notre architecture pour implémenter l'algorithme Deep Q-Network (DQN). Notre algorithme distribué a été appliqué à 49 jeux issus des jeux Atari 2600 de l'environnement d'apprentissage de l'arcade, avec des hyperparamètres identiques. Nos performances ont surpassé celles du DQN non distribué dans 41 des 49 jeux et ont également réduit le temps nécessaire pour obtenir ces résultats d'un ordre de grandeur sur la plupart des jeux.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Méthodes Massivement Parallèles pour l'Apprentissage par Renforcement Profond | Articles | HyperAI