Continuous Control
Le terme « Jeux Informatiques » désigne la technologie permettant de simuler le comportement humain lors du jeu à travers des programmes informatiques. L'objectif est de rechercher et de développer des systèmes intelligents capables d'apprendre et de prendre des décisions de manière autonome. Cette technologie vise à permettre aux machines d'atteindre, voire de surpasser, les niveaux humains dans les jeux, afin de vérifier et d'améliorer la généralité et l'intelligence des algorithmes. Elle est largement utilisée dans le divertissement ludique, la formation éducative et la résolution de problèmes complexes, possédant une valeur scientifique et commerciale considérable.
2D Walker
Acrobot
Acrobot (limited sensors)
Acrobot (noisy observations)
acrobot.swingup
SMuZero
Acrobot (system identifications)
Ant
Ant + Gathering
Ant + Maze
ball_in_cup.catch
Ball in cup, catch (DMControl100k)
Ball in cup, catch (DMControl500k)
Cart-Pole Balancing
TRPO
Cart-Pole Balancing (limited sensors)
Cart-Pole Balancing (noisy observations)
Cart-Pole Balancing (system identifications)
Cart Pole (OpenAI Gym)
MAC
cartpole.balance
cartpole.balance_sparse
cartpole.swingup
Cartpole, swingup (DMControl100k)
Cartpole, swingup (DMControl500k)
cartpole.swingup_sparse
cheetah.run
Cheetah, run (DMControl100k)
Cheetah, run (DMControl500k)
DeepMind Cheetah Run (Images)
DrQ
DeepMind Cup Catch (Images)
DrQ
DeepMind Walker Walk (Images)
DrQ
Double Inverted Pendulum
finger.spin
Finger, spin (DMControl100k)
Finger, spin (DMControl500k)
CURL
finger.turn_easy
finger.turn_hard
fish.swim
Full Humanoid
Half-Cheetah
Hopper
hopper.hop
hopper.stand
humanoid.run
Inverted Pendulum
TRPO
Inverted Pendulum (limited sensors)
Inverted Pendulum (noisy observations)
Inverted Pendulum (system identifications)
Lunar Lander (OpenAI Gym)
SAC
manipulator.insert_ball
manipulator.insert_peg
Mountain Car
Mountain Car (limited sensors)
Mountain Car (noisy observations)
Mountain Car (system identifications)
pendulum.swingup
PyBullet Ant
TD3 gSDE
PyBullet HalfCheetah
SAC
PyBullet Hopper
PyBullet Walker2D
quadruped.run
quadruped.walk
reacher.easy
Reacher, easy (DMControl100k)
Reacher, easy (DMControl500k)
reacher.hard
Simple Humanoid
Swimmer
Swimmer + Gathering
Swimmer + Maze
walker.run
walker.stand
walker.walk
Walker, walk (DMControl100k)
Walker, walk (DMControl500k)
CURL