HyperAI초신경

Continuous Control

게임 플레이 기술은 컴퓨터 프로그램을 통해 인간의 게임 플레이 행동을 시뮬레이션하는 기술로, 자율적으로 학습하고 결정을 내릴 수 있는 지능형 시스템의 연구와 개발을 목표로 합니다. 이 기술의 목적은 기계가 게임에서 인간 수준에 도달하거나 이를 초월하여 알고리즘의 일반성과 지능을 검증하고 향상시키는 것입니다. 게임 플레이 기술은 게임 엔터테인먼트, 교육 훈련, 복잡한 문제 해결 등 다양한 분야에서 널리 적용되며, 중요한 과학적 연구 가치와 상업적 가치를 가지고 있습니다.

2D Walker
Acrobot
Acrobot (limited sensors)
Acrobot (noisy observations)
acrobot.swingup
SMuZero
Acrobot (system identifications)
Ant
Ant + Gathering
Ant + Maze
ball_in_cup.catch
Ball in cup, catch (DMControl100k)
Ball in cup, catch (DMControl500k)
Cart-Pole Balancing
TRPO
Cart-Pole Balancing (limited sensors)
Cart-Pole Balancing (noisy observations)
Cart-Pole Balancing (system identifications)
Cart Pole (OpenAI Gym)
MAC
cartpole.balance
cartpole.balance_sparse
cartpole.swingup
Cartpole, swingup (DMControl100k)
Cartpole, swingup (DMControl500k)
cartpole.swingup_sparse
cheetah.run
Cheetah, run (DMControl100k)
Cheetah, run (DMControl500k)
DeepMind Cheetah Run (Images)
DrQ
DeepMind Cup Catch (Images)
DrQ
DeepMind Walker Walk (Images)
DrQ
Double Inverted Pendulum
finger.spin
Finger, spin (DMControl100k)
Finger, spin (DMControl500k)
CURL
finger.turn_easy
finger.turn_hard
fish.swim
Full Humanoid
Half-Cheetah
Hopper
hopper.hop
hopper.stand
humanoid.run
Inverted Pendulum
TRPO
Inverted Pendulum (limited sensors)
Inverted Pendulum (noisy observations)
Inverted Pendulum (system identifications)
Lunar Lander (OpenAI Gym)
SAC
manipulator.insert_ball
manipulator.insert_peg
Mountain Car
Mountain Car (limited sensors)
Mountain Car (noisy observations)
Mountain Car (system identifications)
pendulum.swingup
PyBullet Ant
TD3 gSDE
PyBullet HalfCheetah
SAC
PyBullet Hopper
PyBullet Walker2D
quadruped.run
quadruped.walk
reacher.easy
Reacher, easy (DMControl100k)
Reacher, easy (DMControl500k)
reacher.hard
Simple Humanoid
Swimmer
Swimmer + Gathering
Swimmer + Maze
walker.run
walker.stand
walker.walk
Walker, walk (DMControl100k)
Walker, walk (DMControl500k)
CURL