L'intelligence Artificielle D'une Famille Hu San Est Là

Microsoft a publié un modèle d'IA pour jouer au mahjong, qui a atteint avec succès le plus haut niveau sur une plateforme compétitive professionnelle. Dans cette activité de divertissement populaire dans tout le pays et même dans le monde, quelles difficultés la naissance d'AI Mahjong God a-t-elle surmontées et quelle est la signification plus profonde de la naissance de cette technologie ?
Lors de la Conférence mondiale sur l'intelligence artificielle qui s'est tenue récemment, Microsoft a lancé un « Dieu du Mahjong IA » - Suphx, qui a dépassé le niveau moyen des meilleurs joueurs humains sur une plateforme de compétition de mahjong professionnelle.
Suphx, dont le nom complet est Super Phoenix, a été lancé sur la plateforme de compétition de mahjong professionnelle japonaise « Tenho » en mars 2019.

Sur cette plateforme de mahjong la plus connue, dans la compétition ouverte « Special Room » à laquelle l'IA peut participer, Suphx a joué plus de 5 000 parties de mahjong à quatre joueurs avec des joueurs humains, montrant progressivement sa propre force et son niveau.
En juin, Suphx avait atteint le rang le plus élevé de la salle spéciale, le dixième rang. Ce qui a empêché Suphx d'atteindre le onzième rang, le « rang Tianfeng », c'est que la plate-forme ne permettait pas au système d'IA d'entrer dans la salle de plus haut niveau pour les batailles.
Depuis le lancement de la plateforme Tianfeng en 2006, environ 180 joueurs ont atteint le dixième niveau du mahjong à quatre joueurs, alors qu'il n'y a qu'une douzaine de joueurs humains actifs au dixième niveau. Mais en termes de rang stable, qui mesure le niveau de force, Suphx a atteint 8,7, bien plus élevé que le 7,4 du joueur humain dixième dan.

Auparavant, il y avait deux autres systèmes d'IA de mahjong actifs sur la plate-forme Tianfeng, à savoir « Blast » publié par l'Université de Tokyo en 2015 et « NAGA25 » publié par Dwango en 2018, mais les rangs stables des deux étaient inférieurs à 6,5, et ils étaient loin derrière Suphx.
Le mahjong, une activité de loisir populaire qui évolue lentement, est une histoire millénaire.
Le Mahjong, également connu sous le nom de « Mahjong » ou « Sparrow Cards », est un jeu chinois authentique.
Il existe de nombreuses histoires différentes sur l'origine du mahjong, et la vérité est impossible à vérifier, mais ce qui est certain, c'est que depuis son avènement, le mahjong est populaire parmi les gens en tant que projet de divertissement national et est resté populaire pendant longtemps.

Les symboles et la production des tuiles de mahjong ont également subi de nombreux changements. Les premières tuiles de mahjongBambou et os d'animauxProduction, et il y a eu aussi une période de jeux de cartes par la suite.
Parmi les dignitaires, des cornes de rhinocéros, de l'ivoire, de l'or, de l'argent, du cuivre et de la porcelaine bleue et blanche étaient utilisés pour fabriquer des tuiles de mahjong. À cette époque, les tuiles de mahjong étaient sculptées une par une par des artisans qualifiés.

Ce n'est qu'après 1960 que la popularisation des produits en plastique et le développement de la mécanisation ont permis au mahjong d'être produit en masse en tant que matériau.
Mais au-delà des changements dans les techniques de production, la technologie la plus avancée dans le mahjong, outre l’IA, pourrait être la machine de mahjong automatique.
L'IA gagne par le raisonnement
Avant la recherche sur l’IA, de nombreuses personnes pensaient que la chance était le facteur décisif au mahjong. Mais en fait, les règles compétitives du mahjong sont en réalité des questions très compliquées.
136 tuiles de MahjongIl existe de nombreux résultats possibles des permutations et des combinaisonsEntre deux jeux d'une carte par le même joueur, il y a des jeux des trois autres joueurs, ainsi que son propre tirage de carte. De plus, « chi », « peng » et « gang » provoqueront des changements dynamiques dans le jeu.
Deuxièmement, c'est unProblème d'information imparfaite. Chaque joueur ne connaît que ses 13 cartes et celles qui ont été jouées, tandis que les cartes des autres joueurs et les cartes fermées restantes sont inconnues. Ces informations cachées conduisent à de nombreuses variables.

Même pour les joueurs expérimentés, il est difficile deClarifier la relation logique entre les cartes connues et le meilleur jeu, les riches informations cachées augmenteront la complexité du jeu.
Cela nécessite une bonne planification stratégique tout au long du processus. Par exemple, lorsque la situation est défavorable, il faut stratégiquement « laisser le quatrième joueur gagner » pour éviter d'être dépassé par le deuxième au score total.
Par conséquent, si vous souhaitez créer une IA experte en Mahjong, une puissance de calcul puissante à elle seule ne suffit pas. Ce qui est plus nécessaire, c'est de faire en sorte que l'IA aitIntuition, prédiction, raisonnementetPrise de décision flouecapacité.
Devenir un grand joueur de mahjong grâce à l'apprentissage par renforcement profond
Pour résoudre les difficultés ci-dessus, Microsoft a utilisé l'apprentissage par renforcement profond pour créer Suphx, qui, grâce aux derniers algorithmes, est progressivement devenu le joueur de mahjong le plus fort du mahjong compétitif grâce à l'apprentissage et au débogage.

La première est l’étape « d’initialisation ». En utilisant les données publiques de la plateforme « Tianfeng », les chercheursApprentissage supervisé, obtenez un modèle initial et, en fonction de ce modèle, utilisez l'auto-jeu pour mener une formation d'apprentissage par renforcement.
Par la suite, pourJeu d'information imparfaiteAfin de relever ce défi, Suphx a testé de manière innovante la technologie de coaching Prophet pour améliorer l'effet de l'apprentissage par renforcement.
Pendant la phase de formation, des informations cachées invisibles sont utilisées pour guider la direction de formation du modèle d'IA, rendant son chemin d'apprentissage plus clair et plus proche du chemin optimal dans le sens d'informations parfaites, incitant ainsi le modèle d'IA à comprendre en profondeur les informations visibles et à trouver des stratégies efficaces à partir de celles-ci.

De plus, pour l'expression complexe des cartes de mahjong et le mécanisme de notation, ils utilisent la technologie de prédiction globale pour construire un pont entre chaque tour de compétition et le résultat final après 8 tours.
Grâce à une conception ingénieusePrédicteur, le modèle peut comprendre l’impact de chaque tour de jeux sur le résultat final, ayant ainsiUne perspective de prise de décision globale.
L'équipe de recherche a également introduit un nouveau mécanisme capable de contrôler dynamiquement le déroulement du jeu, permettant à Suphx d'ajuster sa stratégie en fonction des dernières informations pendant la phase de raisonnement et de prendre des décisions adaptatives.
La dernière étape consiste à entrer dans un véritable combat, en participant constamment à des jeux joués par des joueurs humains, permettant à l'IA d'apprendre et d'améliorer continuellement ses compétences.

Depuis son entrée sur la plateforme Tianfeng en mars, Suphx est en constante évolution. Actuellement, Suphx est capable de mettre en œuvre des stratégies plus intelligentes que les meilleurs joueurs humains pour équilibrer l'attaque et la défense, en complétant stratégiquement le compromis entre les pertes à court terme et les gains à long terme, et en prenant des décisions rapides basées sur les informations ambiguës disponibles.
Mahjong AI : plus que simplement gagner ou perdre à la table
Grâce à son nouvel algorithme et à ses techniques d'entraînement, Suphx est unique dans sa méthode et son style de jeu.
Le meilleur joueur humain de la plateforme Tianfeng a fait l'éloge de Suphx sur les réseaux sociaux. Il avait l'impression d'avoir regardé de nombreux matchs de Suphx et d'avoir appris de nombreuses techniques qu'il n'avait jamais vues auparavant.
De plus, de nombreux joueurs ont déclaré avoir acquis des compétences pratiques de combat en jouant contre Suphx, et l'ont donc appelé le « manuel de mahjong » et le « professeur de Suphx ».

Lorsqu'il s'agit de gagner ou de perdre au mahjong, les gens ordinaires apprécient le frisson de la chance et de l'expérience, tandis que les maîtres apprécient le concours d'intelligence.
Une telle IA « Mahjong God », en plus de créer un entraîneur de mahjong invincible, peut également ouvrir une nouvelle perspective, nous permettant d'analyser ce divertissement à partir de la dimension des algorithmes de données.
Ne plus compter sur la chance comme un joueur, mais sous l'aura de la puissance cérébrale, abandonner progressivement ces choses aléatoires et incertaines et explorer un ensemble de règles pour la victoire.
N’est-ce pas là le rayon de lumière le plus fascinant sur la voie du développement de l’IA ?

Référence de contenu : Titre de Microsoft Research AI « Microsoft Super Mahjong AI Suphx, décryptant les jeux d'information imparfaits » (https://mp.weixin.qq.com/s/S-axCx41WKDJG2BiGGTZfg)