HyperAIHyperAI

Command Palette

Search for a command to run...

ノイジー・ネットワークによる探索

Meire Fortunato; Mohammad Gheshlaghi Azar; Bilal Piot; Jacob Menick; Ian Osband; Alex Graves; Vlad Mnih; Remi Munos; Demis Hassabis; Olivier Pietquin; Charles Blundell; Shane Legg

概要

私たちはパラメトリックノイズを重みに加えた深層強化学習エージェントであるNoisyNetを導入し、その方策の誘導される確率性が効率的な探索を支援することができることを示します。ノイズのパラメータは、残りのネットワークの重みとともに勾配降下法で学習されます。NoisyNetは実装が簡単であり、計算負荷もほとんど増えません。A3C、DQNおよびデューリングエージェント(それぞれエントロピー報酬とε\varepsilonε-グリーディ)の従来の探索ヒューリスティクスをNoisyNetに置き換えることで、アタリゲームの広い範囲において著しく高いスコアを得られることを確認しました。いくつかの場合では、エージェントの性能がサブヒューマンからスーパーヒューマンへと向上しました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています