HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
チュートリアル
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI超神経
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
プラットフォーム
ホーム
SOTA
オープンAIジム
Openai Gym On Humanoid V4
Openai Gym On Humanoid V4
評価指標
Average Return
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
Columns
モデル名
Average Return
Paper Title
MEow
6923.22
Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow
SAC
6211.50
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor
PPO
925.89
Proximal Policy Optimization Algorithms
TD3
198.44
Addressing Function Approximation Error in Actor-Critic Methods
DDPG
139.14
Continuous control with deep reinforcement learning
0 of 5 row(s) selected.
Previous
Next