التحكم المستمر
التحكم المستمر يشير إلى القدرة على تحقيق التحكم الدقيق من خلال سلسلة من التعديلات أو الإجراءات السلسة والمستمرة في بيئات مثل الألعاب. هدفه هو تحسين عملية اتخاذ القرار وتأثير التنفيذ في السيناريوهات التي تتطلب الدقة والتiming والدرجة المناسبة للإجراء. للتحكم المستمر أهمية كبيرة في التطبيقات مثل ألعاب السباقات، محاكاة الشخصيات، ومحاكاة الطيران، حيث يمكن أن يعزز استجابة النظام ومرونته، مما يحسن تجربة المستخدم وأداء النظام.
PyBullet Ant
TD3 gSDE
PyBullet HalfCheetah
SAC
PyBullet Hopper
PyBullet Walker2D
Lunar Lander (OpenAI Gym)
MAC
DeepMind Cheetah Run (Images)
DrQ
cartpole.balance_sparse
cartpole.swingup
cheetah.run
DeepMind Cup Catch (Images)
DrQ
DeepMind Walker Walk (Images)
DrQ
finger.turn_hard
walker.stand
walker.walk
2D Walker
Acrobot
Acrobot (limited sensors)
Acrobot (noisy observations)
acrobot.swingup
SMuZero
Acrobot (system identifications)
Ant
Ant + Gathering
Ant + Maze
Ball in cup, catch (DMControl500k)
Ball in cup, catch (DMControl100k)
ball_in_cup.catch
Cart-Pole Balancing
TRPO
Cart-Pole Balancing (limited sensors)
Cart-Pole Balancing (noisy observations)
Cart-Pole Balancing (system identifications)
Cart Pole (OpenAI Gym)
MAC
cartpole.balance
Cartpole, swingup (DMControl500k)
Cartpole, swingup (DMControl100k)
cartpole.swingup_sparse
Cheetah, run (DMControl500k)
Cheetah, run (DMControl100k)
Double Inverted Pendulum
Finger, spin (DMControl500k)
CURL
Finger, spin (DMControl100k)
finger.spin
finger.turn_easy
fish.swim
Full Humanoid
Half-Cheetah
Hopper
hopper.hop
hopper.stand
humanoid.run
Inverted Pendulum
TRPO
Inverted Pendulum (limited sensors)
Inverted Pendulum (system identifications)
Inverted Pendulum (noisy observations)
manipulator.insert_ball
manipulator.insert_peg
Mountain Car
Mountain Car (limited sensors)
Mountain Car (noisy observations)
Mountain Car (system identifications)
pendulum.swingup
quadruped.run
quadruped.walk
Reacher, easy (DMControl500k)
Reacher, easy (DMControl100k)
reacher.easy
reacher.hard
Simple Humanoid
Swimmer
Swimmer + Gathering
Swimmer + Maze
walker.run
Walker, walk (DMControl500k)
CURL
Walker, walk (DMControl100k)