AI にカードやゲームの遊び方を教えるのは、単に人間を倒すだけではありません

昨日、DeepMindは、開発したAIであるAlphaStarがヨーロッパのサーバーにログインし、StarCraft 2のラダーで人間のプレイヤーと匿名で競争すると発表しました。今日、Facebook が CMU と提携して開発した AI ギャンブルの神様 Pluribus が、6 人参加のテキサス ホールデム ゲームで人間のトップ プレイヤーを破ったというニュースが流れました。ゲーム大会でのAIの活躍はますます顕著になっていますが、ゲームで人間に勝つためにAIを訓練し続ける究極の目的と意義とは何でしょうか?
ちょうど昨日、DeepMind は自社が開発した AI を発表しました AlphaStar は近い将来ヨーロッパのサーバーにログインし、StarCraft 2 のラダーで人間のプレイヤーと匿名で競争する予定です。今日、Facebook は CMU と提携して開発を進めました。 AIギャンブルの神プルリバス 、6人のプレイヤーによるテキサスホールデムゲームで人間のトッププレイヤーを破りました。
なぜ AI は常にチェスやカード ゲームにこれほど興味を持ち、その背後にあるチームはなぜゲームやチェスやカードのコンテストに勝つためにこれほど努力を惜しまないのでしょうか?
最も複雑な戦略ゲーム「StarCraft 2」から始めましょう
『StarCraft』(スタークラフト)は1998年にBlizzard Entertainmentより発売され、2010年には続編の『StarCraft 2』が発売されました。近年考えられている最も難しくてハードコアなリアルタイム ストラテジー ゲーム, さまざまなゲームがAIによって攻略されてきましたが、AIにとってより習得が難しいゲームタイプです。

勝つためには、プレイヤーは複数の要素のバランスを慎重に調整して処理し、タイムリーな計画と対応戦略を立てる必要があります。戦略のみに依存するチェス ゲームとは異なり、このゲームでは AI が上手にプレイしたい場合、不完全な情報の処理、長期的な計画、タイムリーな戦略の学習など、複数の課題に直面する必要があります。
しかし昨年12月、この状況は一変した。人間とAlphaStarの間の11回の「StarCraft 2」ゲームでは、AIが10対1の圧倒的な勝利を収めました。この時点で、AI は StarCraft ゲームに大きな足跡を残しました。
AlphaStar の動作の原動力は、ディープニューラルネットワーク生成されたこのニューラル ネットワークは、ゲーム インターフェイスから入力データ (ユニットとその属性のリスト) を受け取り、ゲーム内アクションを構成する一連の命令を出力します。
不完全な情報に基づいた対局は、多くの場合、最大 1 時間続き、数千の手を必要とします。 StarCraft のすべてのフレームは入力ステップとして使用され、ニューラル ネットワークは、各フレーム後のフレームの残りの部分で予想されるアクションのシーケンスを予測し、最適なアクションを実行します。

DeepMind は、AlphaStar の戦いの成功は実際には、優れたクリック率やより速い反応時間ではなく、優れたマクロおよびミクロの戦略的意思決定によるものであると説明しました。
このテクノロジーは、長期シーケンス モデリングや、翻訳、言語モデリング、視覚的表現などの大規模な出力スペースを含む、機械学習研究における他の多くの課題にも貢献します。
AIはすでにボードゲームを支配している
- 1997 年、コンピューター プログラム「ディープ ブルー」が当時世界ナンバー 1 のチェスプレイヤーを破り、AI が人間のゲーマーを倒す歴史が始まりました。
- 2017年5月、成長を続けるAlphaGoが当時世界トップの囲碁棋士だった柯潔を3対0で破った。その後、わずか 5 か月後、DeepMind は新しいアルゴリズムの亜種を発表しました。 アルファ碁ゼロ、AlphaGo に 100 対 0 のスコアで勝つことができます。
- 2018 年末、Uber AI Research Institute は強化学習アルゴリズムに合格しました。 探索に行く、存在する 「モンテズマの復讐」スコアは 200 万点以上、平均スコアは 400,000 点を超え、Atari ゲーム史上最強のクリア アルゴリズムとして知られています。
- OpenAI Five まず 5 つのニューラル ネットワークに依存します OpenAI Five Dota 2 でアマチュア プレーヤーのチームを破る。 2019年4月、Dota2インターナショナル招待トーナメントで世界チャンピオンのOGチームを2対0で破った。

- そして最近、Facebook と CMU が共同作成したテキサス ホールデム ゴッド オブ ギャンブラー AI が登場しました。 プラスrアイバスは、6 人プレイヤー ゲームで人間のトップ ポーカー プレイヤーを破り、平均して 1 時間ごとにほぼ利益を上げました。千ドル。
チームがポーカーの神様 AI をトレーニングするのにかかる時間はわずか 1 週間もかかりませんでした。

人間は非常に多くの AI を開発し、複数の複雑な e スポーツ ゲームで人間のトップ プレーヤーを破り、人間を震え上がらせました。
しかし、AI は趣味でゲームをするのでしょうか?まず人類を倒し、次に人類に奉仕する
これらのAI企業は、囲碁やeスポーツ、ポーカーの遊び方をアルゴリズムに教えるために多大な労力を費やしており、その姿勢は非常に真剣であるといえる。
OpenAI というツールも開発されました ジムと宇宙 これは、誰もがこのプラットフォームを使用してコンピューターにゲームのプレイを教えることができるオープンソース プラットフォームです。Gym は Atari、Flappy Bird などの小規模なゲームをプレイするために使用され、Snake Universe は GTA5 などの大規模な 3D ゲームをプレイするために使用されます。そしてレース。

彼らは娯楽のためにゲームをプレイするためだけに、莫大なエネルギーとお金を費やしているのでしょうか?それともAIに人間を倒させることで大きな達成感を得ることができるのでしょうか?いいえ、AI 研究者にとって、ゲームは単なる手段であり、目的ではありません。
ゲーム環境:AI 開発全体のアクセラレーターです。
ゲームは完璧な AI テスト プラットフォームです。ゲームは、処理しやすいデータ、固定されたルール、想定されるさまざまな戦略を備えており、人工知能の研究開発には最適な場所です。

ニューヨーク大学ゲーム研究センター准教授のジュリアン・トゲリウス氏は、「ゲームを通じて訓練され、その後現実世界に移されるという例はあまり見たことがない」と述べた。現実世界。」
ゲーム AI: 人間のプレイヤーにとって最高の教師であり対戦相手です
一方で、AI はより完璧な戦略を発見し、人間のプレーヤーの競争力を向上させるのに役立ちます。柯潔は、AlphaGo と対戦することで心が開かれ、囲碁のレベルが向上したと信じています。
一方、AI の介入により、多くのゲームでより知的な対戦相手が作成されます。調整された AI は、人間のプレーヤーのコーチになるだけでなく、さまざまなプレーヤーのレベルに適応して対戦することもできます。
また、今日のゲームで人間のプレイヤーが互いに怒るのを防ぐこともできます。仏教 AI を相手にすれば、より文明的なゲーム環境を維持できることは間違いありません。 ゲームは始まりにすぎません: 世界は広大で、達成すべきことはたくさんあります
DeepMind の CEO、Demis Hassabis 氏は次のように述べています。「DeepMind の目標は、ゲームに勝つことだけではなく、楽しみとインスピレーションを得ることです。」

「しかし、個人的には、私はゲームをするのが好きで、コンピューター ゲームを開発したこともあります。しかし、ある意味、それらはすべてテストベッド、アルゴリズムを作成してテストするためのプラットフォームです。最終的には、テクノロジーを応用して現実世界の問題を解決したいと考えています。」
将来的には、AlphaGo と AlphaStar は AI プレーヤーの名前になるだけでなく、DeepMind はゲームの問題を解決することに限定されず、人間社会の AI ヒーローになるでしょう。
- 以上 -