Control With Prametrised Actions On Half
المقاييس
Goal Probability
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | Goal Probability |
---|---|
discrete-and-continuous-action-representation | 0.639 |
multi-pass-q-networks-for-deep-reinforcement | 0.913 |