Die Künstliche Intelligenz Einer Hu San-Familie Ist Da

Microsoft hat ein KI-Modell zum Mahjong-Spielen veröffentlicht, das auf einer professionellen Wettbewerbsplattform erfolgreich das höchste Niveau erreicht hat. Welche Schwierigkeiten musste bei der Geburt des KI-Mahjong-Gottes überwunden werden, dieser im ganzen Land und sogar auf der ganzen Welt beliebten Unterhaltungsaktivität, und was ist die tiefere Bedeutung der Geburt dieser Technologie?
Auf der kürzlich abgehaltenen World Artificial Intelligence Conference stellte Microsoft mit Suphx einen „KI-Mahjong-Gott“ vor, der das durchschnittliche Niveau der besten menschlichen Spieler auf einer professionellen Mahjong-Wettkampfplattform übertraf.
Suphx, dessen vollständiger Name Super Phoenix lautet, wurde im März 2019 auf Japans professioneller Mahjong-Wettkampfplattform „Tenho“ eingeführt.

Auf dieser bekanntesten Mahjong-Plattform hat Suphx im offenen Wettbewerb „Special Room“, an dem KI teilnehmen kann, mehr als 5.000 Mahjong-Spiele für vier Spieler mit menschlichen Spielern gespielt und dabei nach und nach seine eigene Stärke und sein Niveau unter Beweis gestellt.
Bis Juni hatte Suphx den höchsten Rang des Sonderraums erreicht, den zehnten Rang. Was Suphx daran hinderte, den elften Rang, den „Tianfeng-Rang“, zu erreichen, war, dass die Plattform es dem KI-System nicht erlaubte, den Raum der höchsten Ebene für Kämpfe zu betreten.
Seit der Einführung der Tianfeng-Plattform im Jahr 2006 haben etwa 180 Spieler das zehnte Level im Mahjong für vier Spieler erreicht, während es auf dem zehnten Level nur etwa ein Dutzend aktive menschliche Spieler gibt. Aber im stabilen Rang, der das Stärkeniveau misst, erreichte Suphx 8,7, weit mehr als die 7,4 des menschlichen Spielers mit dem zehnten Dan.

Zuvor waren auf der Tianfeng-Plattform zwei andere Mahjong-KI-Systeme aktiv, nämlich „Blast“, das 2015 von der Universität Tokio veröffentlicht wurde, und „NAGA25“, das 2018 von Dwango veröffentlicht wurde. Die stabilen Ränge beider Systeme lagen jedoch unter 6,5 und sie lagen weit hinter Suphx.
Mahjong mit tausendjähriger Geschichte: eine sich langsam entwickelnde beliebte Freizeitbeschäftigung
Mahjong, auch bekannt als „Mahjong“ oder „Sparrow Cards“, ist ein authentisches chinesisches Spiel.
Es gibt viele verschiedene Geschichten über den Ursprung von Mahjong und der Wahrheitsgehalt lässt sich nicht überprüfen. Sicher ist jedoch, dass Mahjong seit seiner Einführung als nationales Unterhaltungsprojekt bei den Menschen beliebt ist und lange Zeit beliebt geblieben ist.

Auch die Symbole und die Herstellung der Mahjong-Steine haben viele Veränderungen erfahren. Die ersten Mahjong-SteineBambus und TierknochenProduktion, und danach gab es auch eine Zeit des Kartenspielens.
Die Würdenträger verwendeten Nashornhörner, Elfenbein, Gold, Silber, Kupfer sowie blau-weißes Porzellan zur Herstellung von Mahjong-Steinen. Damals wurden Mahjong-Steine einzeln von erfahrenen Handwerkern geschnitzt.

Erst nach 1960 ermöglichten die zunehmende Verbreitung von Kunststoffprodukten und die Entwicklung der Mechanisierung die Massenproduktion von Mahjong als Material.
Doch abgesehen von den Veränderungen in den Produktionstechniken ist die neben der KI fortschrittlichste Technologie im Mahjong möglicherweise die automatische Mahjong-Maschine.
KI gewinnt durch logisches Denken
Vor der KI-Forschung glaubten viele Menschen, dass Glück der entscheidende Faktor beim Mahjong sei. Tatsächlich handelt es sich bei den Wettkampfregeln von Mahjong jedoch um eine sehr komplizierte Angelegenheit.
136 Mahjong-SteineEs gibt viele mögliche Ergebnisse von Permutationen und KombinationenZwischen zwei Kartenausspielungen desselben Spielers finden Ausspielungen der anderen drei Spieler sowie das eigene Kartenziehen statt. Darüber hinaus sorgen „Chi“, „Peng“ und „Gang“ für dynamische Veränderungen im Spiel.
Zweitens handelt es sich um eineProblem unvollständiger Informationen. Jeder Spieler kennt nur seine eigenen 13 Karten und die gespielten Karten, während die Karten der anderen Spieler und die restlichen Hole Cards unbekannt sind. Diese versteckten Informationen führen zu vielen Variablen.

Selbst für erfahrene Spieler ist es schwierig,Klären Sie die logische Beziehung zwischen bekannten Karten und dem besten Spiel, die zahlreichen versteckten Informationen erhöhen die Komplexität des Spiels.
Dies erfordert eine gute strategische Planung während des gesamten Prozesses. Beispielsweise kann man bei ungünstigen Situationen strategisch „den vierten Spieler gewinnen lassen“, um zu verhindern, dass man in der Gesamtwertung vom Zweitplatzierten überholt wird.
Wenn Sie also eine professionelle Mahjong-KI erstellen möchten, reicht eine starke Rechenleistung nicht aus. Was noch notwendiger ist, ist, die KI dazu zu bringen,Intuition, Vorhersage, ArgumentationUndUnscharfe EntscheidungsfindungFähigkeit.
Durch Deep Reinforcement Learning zum großartigen Mahjong-Spieler werden
Um die oben genannten Schwierigkeiten zu lösen, verwendete Microsoft Deep Reinforcement Learning, um Suphx zu entwickeln, das mithilfe der neuesten Algorithmen durch Lernen und Debuggen nach und nach zum stärksten Mahjong-Spieler im Mahjong-Wettkampf wurde.

Die erste ist die „Initialisierungsphase“. Mithilfe der öffentlichen Daten der Plattform „Tianfeng“Überwachtes Lernen, erhalten Sie ein erstes Modell und verwenden Sie auf der Grundlage des Modells Self-Game, um ein Reinforcement-Learning-Training durchzuführen.
Anschließend fürSpiel mit unvollkommenen InformationenUm dieser Herausforderung zu begegnen, hat Suphx auf innovative Weise die Prophet-Coaching-Technologie ausprobiert, um die Wirkung des bestärkenden Lernens zu verbessern.
Während der Trainingsphase werden unsichtbare, verborgene Informationen verwendet, um die Trainingsrichtung des KI-Modells zu steuern. Dadurch wird sein Lernpfad klarer und nähert sich dem optimalen Pfad im Sinne perfekter Informationen an. Dadurch wird das KI-Modell dazu angeregt, sichtbare Informationen gründlich zu verstehen und daraus wirksame Strategien abzuleiten.

Darüber hinaus verwenden sie für den komplexen Mahjong-Kartenausdruck und den Punktemechanismus die umfassende Vorhersagetechnologie, um eine Brücke zwischen jeder Wettbewerbsrunde und dem Endergebnis nach 8 Runden zu bauen.
Durch ausgeklügeltes DesignPrädiktorDas Modell kann den Einfluss jeder Spielrunde auf das Endergebnis verstehen und hat somitEine globale Entscheidungsperspektive.
Das Forschungsteam führte außerdem einen neuen Mechanismus ein, der den Spielverlauf dynamisch steuern kann, sodass Suphx seine Strategie während der Denkphase auf Grundlage der neuesten Informationen anpassen und adaptive Entscheidungen treffen kann.
Der letzte Schritt besteht darin, in den eigentlichen Kampf einzutreten, indem man ständig an Spielen teilnimmt, die von menschlichen Spielern gespielt werden, wodurch die KI kontinuierlich lernt und ihre Fähigkeiten verbessert.

Seit dem Eintritt in die Tianfeng-Plattform im März hat sich Suphx ständig weiterentwickelt. Derzeit ist Suphx in der Lage, intelligentere Strategien als die besten menschlichen Spieler zu entwickeln, wenn es darum geht, Angriff und Verteidigung auszubalancieren, den Kompromiss zwischen kurzfristigen Verlusten und langfristigen Gewinnen strategisch abzuschließen und auf der Grundlage der verfügbaren, mehrdeutigen Informationen schnelle Entscheidungen zu treffen.
Mahjong AI: Mehr als nur Gewinnen oder Verlieren am Tisch
Dank seines neuen Algorithmus und seiner Trainingstechniken ist Suphx in seiner Spielmethode und seinem Stil einzigartig.
Der beste menschliche Spieler auf der Tianfeng-Plattform lobte Suphx in den sozialen Medien. Er hatte das Gefühl, dass er viele Spiele von Suphx gesehen und viele Techniken gelernt hatte, die er noch nie zuvor gesehen hatte.
Darüber hinaus sagten viele Spieler, dass sie beim Spielen gegen Suphx praktische Kampffähigkeiten erlernt hätten und nannten ihn daher das „Mahjong-Lehrbuch“ und den „Suphx-Lehrer“.

Wenn es beim Mahjong ums Gewinnen oder Verlieren geht, genießen normale Leute den Nervenkitzel von Glück und Erfahrung, während Meister den Wettkampf der Intelligenz genießen.
Eine solche „Mahjong-Gott“-KI kann nicht nur einen unbesiegbaren Mahjong-Trainer erschaffen, sondern auch eine neue Perspektive eröffnen, die es uns ermöglicht, diese Unterhaltung aus der Dimension der Datenalgorithmen zu analysieren.
Verlassen Sie sich nicht mehr wie ein Spieler auf Ihr Glück, sondern lassen Sie unter der Aura Ihrer Gehirnleistung nach und nach diese zufälligen und unsicheren Dinge hinter sich und erkunden Sie eine Reihe von Regeln für den Sieg.
Ist dies nicht der faszinierendste Lichtblick auf dem Weg der KI-Entwicklung?

Inhaltsreferenz: Schlagzeile von Microsoft Research AI „Microsoft Super Mahjong AI Suphx, cracking imperfect information games“ (https://mp.weixin.qq.com/s/S-axCx41WKDJG2BiGGTZfg)