التحكم المستمر
التحكم المستمر يشير إلى القدرة على تحقيق التحكم الدقيق من خلال سلسلة من التعديلات أو الإجراءات السلسة والمستمرة في بيئات مثل الألعاب. هدفه هو تحسين عملية اتخاذ القرار وتأثير التنفيذ في السيناريوهات التي تتطلب الدقة والتiming والدرجة المناسبة للإجراء. للتحكم المستمر أهمية كبيرة في التطبيقات مثل ألعاب السباقات، محاكاة الشخصيات، ومحاكاة الطيران، حيث يمكن أن يعزز استجابة النظام ومرونته، مما يحسن تجربة المستخدم وأداء النظام.
PyBullet Ant
TD3 gSDE
PyBullet Hopper
PyBullet Walker2D
PyBullet HalfCheetah
SAC
Lunar Lander (OpenAI Gym)
MAC
DeepMind Cheetah Run (Images)
DrQ
DeepMind Walker Walk (Images)
DrQ
finger.turn_hard
cheetah.run
DeepMind Cup Catch (Images)
DrQ
cartpole.balance_sparse
cartpole.swingup
walker.stand
walker.walk
hopper.stand
pendulum.swingup
reacher.hard
Mountain Car (system identifications)
Ant
Swimmer
Hopper
ball_in_cup.catch
Cheetah, run (DMControl500k)
Mountain Car
Mountain Car (limited sensors)
Acrobot (limited sensors)
Acrobot (system identifications)
Ball in cup, catch (DMControl500k)
cartpole.swingup_sparse
Double Inverted Pendulum
humanoid.run
Inverted Pendulum
TRPO
2D Walker
cartpole.balance
Reacher, easy (DMControl500k)
acrobot.swingup
SMuZero
finger.spin
Cart-Pole Balancing (noisy observations)
Swimmer + Maze
Walker, walk (DMControl100k)
Finger, spin (DMControl100k)
Cart-Pole Balancing (system identifications)
walker.run
Cartpole, swingup (DMControl500k)
Cart-Pole Balancing
TRPO
Ball in cup, catch (DMControl100k)
quadruped.walk
manipulator.insert_ball
Cartpole, swingup (DMControl100k)
Mountain Car (noisy observations)
Inverted Pendulum (noisy observations)
Cheetah, run (DMControl100k)
Reacher, easy (DMControl100k)
Walker, walk (DMControl500k)
CURL
finger.turn_easy
Acrobot
Swimmer + Gathering
Cart Pole (OpenAI Gym)
MAC
Ant + Gathering
Cart-Pole Balancing (limited sensors)
fish.swim
Simple Humanoid
quadruped.run
manipulator.insert_peg
Inverted Pendulum (system identifications)
reacher.easy
Full Humanoid
Finger, spin (DMControl500k)
CURL
hopper.hop
Ant + Maze
Half-Cheetah
Inverted Pendulum (limited sensors)
Acrobot (noisy observations)