HyperAI超神経

Openai Gym On Ant V2

評価指標

Mean Reward

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Mean Reward
advantage-weighted-regression-simple-and5067
temporally-layered-architecture-for-efficient5163.54