연속 제어
Continuous Control는 게임과 같은 환경에서 정확한 제어를 위해 일련의 부드럽고 지속적인 조정 또는 행동을 수행하는 능력을 의미합니다. 이 기술의 목적은 정확성, 타이밍, 행동의 정도가 필요한 시나리오에서 의사결정 과정과 실행 효과를 최적화하는 것입니다. Continuous Control은 레이싱 게임, 캐릭터 시뮬레이션, 비행 시뮬레이터 등 다양한 응용 분야에서 큰 가치를 가지며, 시스템의 반응성과 유연성을 향상시켜 사용자 경험과 시스템 성능을 개선할 수 있습니다.
PyBullet Ant
TD3 gSDE
PyBullet HalfCheetah
SAC
PyBullet Hopper
PyBullet Walker2D
Lunar Lander (OpenAI Gym)
MAC
DeepMind Cheetah Run (Images)
DrQ
cartpole.balance_sparse
cartpole.swingup
cheetah.run
DeepMind Cup Catch (Images)
DrQ
DeepMind Walker Walk (Images)
DrQ
finger.turn_hard
walker.stand
walker.walk
2D Walker
Acrobot
Acrobot (limited sensors)
Acrobot (noisy observations)
acrobot.swingup
SMuZero
Acrobot (system identifications)
Ant
Ant + Gathering
Ant + Maze
Ball in cup, catch (DMControl500k)
Ball in cup, catch (DMControl100k)
ball_in_cup.catch
Cart-Pole Balancing
TRPO
Cart-Pole Balancing (limited sensors)
Cart-Pole Balancing (noisy observations)
Cart-Pole Balancing (system identifications)
Cart Pole (OpenAI Gym)
MAC
cartpole.balance
Cartpole, swingup (DMControl500k)
Cartpole, swingup (DMControl100k)
cartpole.swingup_sparse
Cheetah, run (DMControl500k)
Cheetah, run (DMControl100k)
Double Inverted Pendulum
Finger, spin (DMControl500k)
CURL
Finger, spin (DMControl100k)
finger.spin
finger.turn_easy
fish.swim
Full Humanoid
Half-Cheetah
Hopper
hopper.hop
hopper.stand
humanoid.run
Inverted Pendulum
TRPO
Inverted Pendulum (limited sensors)
Inverted Pendulum (system identifications)
Inverted Pendulum (noisy observations)
manipulator.insert_ball
manipulator.insert_peg
Mountain Car
Mountain Car (limited sensors)
Mountain Car (noisy observations)
Mountain Car (system identifications)
pendulum.swingup
quadruped.run
quadruped.walk
Reacher, easy (DMControl500k)
Reacher, easy (DMControl100k)
reacher.easy
reacher.hard
Simple Humanoid
Swimmer
Swimmer + Gathering
Swimmer + Maze
walker.run
Walker, walk (DMControl500k)
CURL
Walker, walk (DMControl100k)