Control With Prametrised Actions On Half
評価指標
Goal Probability
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Goal Probability |
---|---|
discrete-and-continuous-action-representation | 0.639 |
multi-pass-q-networks-for-deep-reinforcement | 0.913 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Goal Probability |
---|---|
discrete-and-continuous-action-representation | 0.639 |
multi-pass-q-networks-for-deep-reinforcement | 0.913 |