連続制御

連続制御とは、ゲームなどの環境において、一連の滑らかで継続的な調整や行動を通じて精密な制御を達成する能力のことです。その目的は、精度、タイミング、行動の度合いが求められるシナリオにおける意思決定プロセスと実行効果を最適化することにあります。連続制御は、レースゲーム、キャラクターシミュレーション、フライトシミュレーターなどのアプリケーションにおいて大きな価値を持ち、システムの応答性と柔軟性を向上させ、ユーザーエクスペリエンスとシステムパフォーマンスを改善することができます。

PyBullet Ant
TD3 gSDE
PyBullet HalfCheetah
SAC
PyBullet Hopper
PyBullet Walker2D
Lunar Lander (OpenAI Gym)
MAC
DeepMind Cheetah Run (Images)
DrQ
cartpole.balance_sparse
cartpole.swingup
cheetah.run
DeepMind Cup Catch (Images)
DrQ
DeepMind Walker Walk (Images)
DrQ
finger.turn_hard
walker.stand
walker.walk
2D Walker
Acrobot
Acrobot (limited sensors)
Acrobot (noisy observations)
acrobot.swingup
SMuZero
Acrobot (system identifications)
Ant
Ant + Gathering
Ant + Maze
Ball in cup, catch (DMControl500k)
Ball in cup, catch (DMControl100k)
ball_in_cup.catch
Cart-Pole Balancing
TRPO
Cart-Pole Balancing (limited sensors)
Cart-Pole Balancing (noisy observations)
Cart-Pole Balancing (system identifications)
Cart Pole (OpenAI Gym)
MAC
cartpole.balance
Cartpole, swingup (DMControl500k)
Cartpole, swingup (DMControl100k)
cartpole.swingup_sparse
Cheetah, run (DMControl500k)
Cheetah, run (DMControl100k)
Double Inverted Pendulum
Finger, spin (DMControl500k)
CURL
Finger, spin (DMControl100k)
finger.spin
finger.turn_easy
fish.swim
Full Humanoid
Half-Cheetah
Hopper
hopper.hop
hopper.stand
humanoid.run
Inverted Pendulum
TRPO
Inverted Pendulum (limited sensors)
Inverted Pendulum (system identifications)
Inverted Pendulum (noisy observations)
manipulator.insert_ball
manipulator.insert_peg
Mountain Car
Mountain Car (limited sensors)
Mountain Car (noisy observations)
Mountain Car (system identifications)
pendulum.swingup
quadruped.run
quadruped.walk
Reacher, easy (DMControl500k)
Reacher, easy (DMControl100k)
reacher.easy
reacher.hard
Simple Humanoid
Swimmer
Swimmer + Gathering
Swimmer + Maze
walker.run
Walker, walk (DMControl500k)
CURL
Walker, walk (DMControl100k)
連続制御 | SOTA | HyperAI超神経