HyperAIHyperAI

Command Palette

Search for a command to run...

Architectures de réseaux duels pour l'apprentissage par renforcement profond

Ziyu Wang Tom Schaul Matteo Hessel Hado van Hasselt Marc Lanctot Nando de Freitas

Résumé

Ces dernières années ont vu de nombreux succès dans l'utilisation de représentations profondes en apprentissage par renforcement. Néanmoins, beaucoup de ces applications utilisent encore des architectures conventionnelles, telles que les réseaux de neurones convolutifs, les LSTM (Long Short-Term Memory) ou les auto-encodeurs. Dans cet article, nous présentons une nouvelle architecture de réseau neuronal pour l'apprentissage par renforcement sans modèle. Notre réseau duel représente deux estimateurs distincts : un pour la fonction de valeur d'état et un autre pour la fonction d'avantage d'action dépendante de l'état. Le principal avantage de cette factorisation est de généraliser l'apprentissage sur les actions sans imposer aucun changement à l'algorithme d'apprentissage par renforcement sous-jacent. Nos résultats montrent que cette architecture conduit à une meilleure évaluation des politiques en présence d'actions aux valeurs similaires. De plus, l'architecture duel permet à notre agent d'apprentissage par renforcement de surpasser l'état de l'art dans le domaine Atari 2600.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp