HyperAIHyperAI

Command Palette

Search for a command to run...

PokerBench ポーカー ゲーム評価データセット

日付

1年前

サイズ

40.04 MB

データセット構成

カリフォルニア大学バークレー校

公開URL

github.com

Paper URL

arxiv.org

PokerBench は、カリフォルニア大学バークレー校とジョージア工科大学の研究チームによって 2025 年に開発されたポーカー ゲーム評価データ セットで、複雑で戦略的なポーカー ゲームにおける大規模言語モデル (LLM) のパフォーマンスを評価するように設計されています。 .」の関連論文検索結果。PokerBench: 大規模な言語モデルをトレーニングしてプロのポーカー プレーヤーになる”。データセットには 11,000 の主要なシナリオが含まれており、1,000 のプリフロップ シナリオと 10,000 のポストフロップ シナリオに分かれており、幅広いゲーム状況をカバーしています。

このデータセットは、Game Theoretic Optimal (GTO) ポーカー戦略に基づいて作成され、その多様性と代表性を確保するためにプロのポーカー プレーヤーと協力して開発されました。 GTOWizard および WASM-Postflop ツールを使用することにより、データセットは各シナリオの決定が最適な戦略に沿っていることを保証します。さらに、データセットはポーカー ゲームの複雑なデシジョン ツリーを考慮して構築されており、フィルタリングおよびプルーニング戦略を通じて包括的かつ効率的な評価が保証されています。

このデータセットを通じて、研究者はポーカー ゲームにおけるモデルのパフォーマンス、特に数学的推論、戦略計画、対戦相手の行動の予測における能力を迅速に評価できます。

データの概要
PokerBench.torrent
シーディング 1ダウンロード中 0完了 150総ダウンロード数 290
  • PokerBench/
    • README.md
      1.85 KB
    • README.txt
      3.7 KB
      • data/
        • poker.zip
          40.04 MB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています