Openai Gym On Invertedpendulum V2
المقاييس
Action Repetition
Average Decisions
Mean Reward
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
اسم النموذج | Action Repetition | Average Decisions | Mean Reward | Paper Title | Repository |
---|---|---|---|---|---|
TLA | .8882 | 111.79 | 1000 | Optimizing Attention and Cognitive Control Costs Using Temporally-Layered Architectures |
0 of 1 row(s) selected.