Command Palette

Search for a command to run...

PokerBench ポーカー ゲーム評価データセット

日付

10ヶ月前

サイズ

40.04 MB

組織

カリフォルニア大学バークレー校

公開URL

github.com

論文URL

arxiv.org

PokerBench は、カリフォルニア大学バークレー校とジョージア工科大学の研究チームによって 2025 年に開発されたポーカー ゲーム評価データ セットで、複雑で戦略的なポーカー ゲームにおける大規模言語モデル (LLM) のパフォーマンスを評価するように設計されています。 .」の関連論文検索結果。PokerBench: 大規模な言語モデルをトレーニングしてプロのポーカー プレーヤーになる”。データセットには 11,000 の主要なシナリオが含まれており、1,000 のプリフロップ シナリオと 10,000 のポストフロップ シナリオに分かれており、幅広いゲーム状況をカバーしています。

このデータセットは、Game Theoretic Optimal (GTO) ポーカー戦略に基づいて作成され、その多様性と代表性を確保するためにプロのポーカー プレーヤーと協力して開発されました。 GTOWizard および WASM-Postflop ツールを使用することにより、データセットは各シナリオの決定が最適な戦略に沿っていることを保証します。さらに、データセットはポーカー ゲームの複雑なデシジョン ツリーを考慮して構築されており、フィルタリングおよびプルーニング戦略を通じて包括的かつ効率的な評価が保証されています。

このデータセットを通じて、研究者はポーカー ゲームにおけるモデルのパフォーマンス、特に数学的推論、戦略計画、対戦相手の行動の予測における能力を迅速に評価できます。

データの概要
PokerBench.torrent
シーディング 1ダウンロード中 0ダウンロード完了 121総ダウンロード数 247
  • PokerBench/
    • README.md
      1.85 KB
    • README.txt
      3.7 KB
      • data/
        • poker.zip
          40.04 MB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
PokerBench ポーカー ゲーム評価データセット | データセット | HyperAI超神経