HyperAIHyperAI

Command Palette

Search for a command to run...

離散的行動設定におけるソフトアクターカリック

Petros Christodoulou

概要

Soft Actor-Criticは、連続的アクション設定において最先端の強化学習アルゴリズムであるが、離散的アクション設定には適用できない。しかしながら、多くの重要な設定では離散的アクションが関与しており、そこで本研究では離散的アクション設定に適用可能なSoft Actor-Criticの代替版を導出する。さらに、ハイパーパラメータのチューニングを行わずに、Atariゲームセットから選ばれた複数のゲームにおいて、チューニング済みのモデルフリー最先端手法と同等の性能を達成できることを示す。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
離散的行動設定におけるソフトアクターカリック | 記事 | HyperAI超神経