Apprendre À L’ia À Jouer Aux Cartes Et À Des Jeux Ne Consiste Pas Seulement À Vaincre Les Humains

Hier, DeepMind a annoncé que son IA, AlphaStar, sera disponible sur le serveur européen, où elle rivalisera anonymement avec des joueurs humains dans le classement StarCraft 2. Aujourd'hui, la nouvelle selon laquelle Pluribus, un joueur IA développé par Facebook et CMU, a battu les meilleurs joueurs humains dans une partie de Texas Hold'em à six joueurs a une fois de plus dominé l'actualité. L’IA est de plus en plus performante dans les compétitions de jeux, mais nous formons constamment l’IA pour vaincre les humains dans les jeux. Quel est le but ultime et la signification ?
Hier encore, DeepMind a annoncé que son IA AlphaStar sera bientôt disponible sur le serveur européen et affrontera anonymement des joueurs humains dans le ladder de StarCraft 2.Aujourd'hui, Facebook et CMU ont développé conjointement Pluribus, le dieu du jeu IA , en battant les meilleurs joueurs humains dans un tournoi de Texas Hold'em à six joueurs.
Pourquoi l’IA est-elle toujours aussi intéressée par les jeux de société et pourquoi l’équipe derrière elle travaille-t-elle si dur pour gagner des jeux et des compétitions de société ?
Commençons par le jeu de stratégie le plus complexe « StarCraft 2 »
StarCraft a été lancé par Blizzard Entertainment en 1998, et sa suite StarCraft 2 est sortie en 2010. Il est considéré commeLe jeu de stratégie en temps réel le plus difficile et le plus hardcore, bien que divers jeux aient été conquis par l'IA, il s'agit d'un type de jeu relativement difficile à maîtriser pour l'IA.

Pour gagner, les joueurs doivent soigneusement équilibrer et gérer plusieurs facteurs, et élaborer des plans et des stratégies de réponse opportuns. Contrairement aux jeux d’échecs qui reposent uniquement sur la stratégie, l’IA doit faire face à de multiples défis pour bien jouer dans ce jeu, notamment gérer des informations imparfaites, élaborer des plans à long terme, apprendre des stratégies opportunes, etc.
Mais en décembre dernier, la situation a radicalement changé. Dans 11 parties de StarCraft 2 entre les humains et AlphaStar, l'IA a remporté une victoire écrasante avec un score de 10:1.À ce stade, l’IA a laissé une forte empreinte sur le jeu StarCraft.
Le comportement d'AlphaStar est déterminé parRéseaux neuronaux profondsLe réseau neuronal prend les données d'entrée de l'interface du jeu (une liste d'unités et leurs attributs) et génère une série d'instructions qui constituent les actions du jeu.
Basés sur des informations imparfaites, les jeux durent généralement jusqu'à une heure et nécessitent des milliers de coups. Chaque image de StarCraft est utilisée comme étape d'entrée,Le réseau neuronal prédit la séquence d’actions attendue pour le reste de chaque image, puis prend la meilleure action.

DeepMind a expliqué que le succès d'AlphaStar dans le jeu était en fait dû à d'excellentes décisions stratégiques macro et micro, plutôt qu'à un taux de clics supérieur ou à un temps de réaction plus rapide.
Cette technologie peut également aider à relever de nombreux autres défis dans la recherche en apprentissage automatique, notamment la modélisation de séquences à long terme et de grands espaces de sortie, tels que la traduction, la modélisation du langage et la représentation visuelle.
L'IA a pris le contrôle des jeux de société
- En 1997, le programme informatique « Deep Blue » a battu le meilleur joueur d'échecs du monde de l'époque, marquant la première fois que l'IA a vaincu des joueurs humains.
- En mai 2017, l'équipe en pleine croissance AlphaGo a battu Ke Jie, le meilleur joueur de Go du monde à l'époque, 3:0. Puis, seulement cinq mois plus tard, DeepMind a annoncé une nouvelle variante d’algorithme : AlphaGo Zéro, a pu battre AlphaGo avec un score de 100 à 0 ;
- Fin 2018, l'Uber AI Research Institute a utilisé des algorithmes d'apprentissage par renforcement Go-Explore,exister La revanche de MontezumaLe score a dépassé les 2 millions, avec un score moyen de plus de 400 000, et est connu comme l'algorithme de déblocage le plus puissant de l'histoire des jeux Atari ;
- OpenAI Five Tout d’abord, nous nous appuyons sur 5 réseaux de neurones. OpenAI Five Battez une équipe de joueurs amateurs de Dota 2. En avril 2019, ils ont battu l'équipe championne du monde OG 2:0 lors du Dota2 International Invitational.

- Puis, récemment, l'IA du Texas Hold'em Poker God, créée conjointement par Facebook et CMU, Pluribus, dans une partie à six joueurs, vaincre les meilleurs joueurs humains de Texas Hold'em peut rapporter près deMille dollars.
Il a fallu moins d'une semaine à l'équipe pour former cette IA de jeu de Texas Hold'em.

Les humains ont développé de nombreuses IA qui ont vaincu les meilleurs joueurs humains dans de nombreux jeux d’e-sport complexes, faisant trembler les humains de peur.
Mais l’IA joue-t-elle à des jeux juste pour le plaisir ?D'abord vaincre l'humanité, puis servir l'humanité
Afin d'enseigner aux algorithmes à jouer au Go, aux sports électroniques et au poker, ces sociétés d'IA ont déployé beaucoup d'efforts et leur attitude peut être considérée comme très sérieuse.
OpenAI a même développé un Gymnase et Univers Une plateforme open source qui permet à chacun d'utiliser cette plateforme pour apprendre aux ordinateurs à jouer à des jeux. Gym est utilisé pour jouer à de petits jeux tels qu'Atari, Flappy Bird et Snake, tandis que Universe est utilisé pour jouer à de grands jeux 3D tels que GTA5 et les courses.

Dépensent-ils d’énormes quantités d’énergie et de ressources financières juste pour jouer à des jeux pour se divertir ? Ou est-ce que le fait que l’IA batte les humains leur donne un grand sentiment d’accomplissement ? Non, pour les chercheurs en IA, les jeux ne sont qu’une méthode, pas un objectif.
Environnement de jeu :C'est un accélérateur pour le développement global de l'IA
Les jeux sont la plateforme de test idéale pour l’IA.Les jeux comportent des données faciles à traiter, des règles fixes et une variété de stratégies hypothétiques. Les jeux sont des scénarios simulés, ce qui en fait un lieu idéal pour la recherche et le développement de l’intelligence artificielle.

« Nous n’avons pas vu beaucoup de choses être apprises par le biais de jeux et ensuite transférées dans le monde réel », a déclaré Julian Togelius, professeur associé au Center for Game Studies de l’Université de New York. « Mais nous avons vu des méthodes inventées pour jouer à des jeux se transférer dans le monde réel. »
IA de jeu : le meilleur professeur et adversaire pour les joueurs humains
D’un côté, l’IA peut aider à découvrir des stratégies plus parfaites et à améliorer les compétences compétitives des joueurs humains. Ke Jie pense que le match avec AlphaGo lui a ouvert l'esprit et a amélioré ses compétences au Go.
D’un autre côté, l’intervention de l’IA créera un adversaire plus intelligent pour de nombreux jeux. L'IA ajustée peut non seulement devenir un entraîneur pour les joueurs humains, mais également s'adapter aux niveaux des différents joueurs pour jouer contre eux.
Cela peut également empêcher les joueurs humains dans les jeux d’aujourd’hui de se mettre en colère les uns contre les autres. S'il y a une IA bouddhiste en face de vous, elle maintiendra certainement un environnement de jeu plus civilisé. Le jeu n’est que le début : il y a beaucoup à faire
Demis Hassabis, PDG de DeepMind, a déclaré : « L'objectif de DeepMind n'est pas seulement de gagner la partie, mais aussi de s'amuser et d'être inspiré par celle-ci. »

Personnellement, j'aime jouer à des jeux vidéo et j'en ai développé. Mais d'une certaine manière, ce sont tous des bancs d'essai où l'on essaie d'écrire des algorithmes et de les tester.À terme, nous espérons appliquer notre technologie pour résoudre des problèmes du monde réel."
À l'avenir, AlphaGo et AlphaStar ne seront pas seulement les noms des joueurs IA qui contrôlent les héros du jeu, et DeepMind ne se limitera pas à résoudre les problèmes du jeu. Ils deviendront les héros de l’IA de la société humaine.
-- sur--