HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux bruyants pour l'exploration

Meire Fortunato; Mohammad Gheshlaghi Azar; Bilal Piot; Jacob Menick; Ian Osband; Alex Graves; Vlad Mnih; Remi Munos; Demis Hassabis; Olivier Pietquin; Charles Blundell; Shane Legg

Résumé

Nous présentons NoisyNet, un agent d'apprentissage par renforcement profond auquel une perturbation paramétrique est ajoutée aux poids de ses neurones, et nous montrons que la stochasticité induite par cette perturbation peut être utilisée pour faciliter l'exploration efficace. Les paramètres de la perturbation sont appris par descente de gradient en même temps que les autres poids du réseau. NoisyNet est simple à mettre en œuvre et ajoute peu de surcoût computationnel. Nous constatons que le remplacement des heuristiques d'exploration conventionnelles pour les agents A3C, DQN et dueling (récompense d'entropie et ε\varepsilonε-greedy respectivement) par NoisyNet permet d'obtenir des scores nettement plus élevés pour une large gamme de jeux Atari, faisant passer dans certains cas la performance de l'agent d'une performance inférieure à humaine à une performance supérieure à humaine.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp