HyperAI

8日前

マサチューセッツ工科大学（MIT）とUT Austin、UC Berkeley、CMU、NYUらの研究チームは、4月にリオデジャネイロで開催された国際会議ICLRにて、不完全情報ゲームにおけるAI戦略アルゴリズムの評価手法に関する論文を発表した。従来、ゲーム理論に基づく専門アルゴリズムが政策勾配法を上回ると考えられてきたが、本研究はその常識を覆す成果を得た。チームは2人のプレイヤーが関わるゼロサムゲームでニューラルネットワークを訓練する際、政策勾配法の性能が専門アルゴリズムより優れる可能性に注目し、公平な比較を可能にするベンチマークツールを開発した。評価には最悪の対戦相手に対する適応度を測るエクスプロイタビリティ指標を採用。不完全情報版のドドナベやヘックス、嘘つきサイバーなど5つのゲームで実験を実施した。実験結果、政策勾配法で学習したエージェントはゲーム理論系アルゴリズムを大きく上回るスコアを記録し、対戦テストでも勝利した。従来、数十億状態を扱う大規模ゲームでのエクスプロイタビリティ計算は計算コストが膨大だったが、本ベンチマークは標準ライブラリOpenSpielに数行追加するだけでノートPCで動作可能となり、オープンソースで公開された。研究を率いるMITのガブリエレ・ファリーナ助教らは、ゲームという枠組みは軍事作戦、金融取引、交渉など不確実な実世界の戦略的相互作用にも応用できると指摘。専門外のAI研究者も、古典的手法の現代的見直しが複雑な戦略問題解決に有効であることを示す重要な知見であると評価している。本研究は、不確実下での意思決定アルゴリズム開発の検証基盤を整備し、実社会の戦略的AI応用に新たな道筋を開いた。

このニュースは、業界の最新情報を効率的に提供するため、AIによって自動的に集約されています。内容は意見や助言を構成するものではありません。

関連リンク

関連リンク

関連リンク

オンラインチュートリアル | UC Berkeley/NVIDIAなどが、GPUメモリを4倍節約し、トレーニング時間を10%短縮するオープンソースの3DGSライブラリgsplatをリリースしました。

オンラインチュートリアル | UC Berkeley/NVIDIAなどが、GPUメモリを4倍節約し、トレーニング時間を10%短縮するオープンソースの3DGSライブラリgsplatをリリースしました。

Command Palette

ゲーム理論：汎用アルゴリズムが特化型を破る

関連リンク

Command Palette

ゲーム理論：汎用アルゴリズムが特化型を破る

関連リンク

Command Palette

ゲーム理論：汎用アルゴリズムが特化型を破る

関連リンク

オンラインチュートリアル | UC Berkeley/NVIDIAなどが、GPUメモリを4倍節約し、トレーニング時間を10%短縮するオープンソースの3DGSライブラリgsplatをリリースしました。

オンラインチュートリアル | UC Berkeley/NVIDIAなどが、GPUメモリを4倍節約し、トレーニング時間を10%短縮するオープンソースの3DGSライブラリgsplatをリリースしました。