HyperAIHyperAI

Command Palette

Search for a command to run...

PokerBench-Datensatz Zur Pokerspielbewertung

Date

vor einem Jahr

Size

40.04 MB

Organization

Universität von Kalifornien, Berkeley

Publish URL

github.com

Paper URL

arxiv.org

PokerBench ist ein Datensatz zur Bewertung von Pokerspielen, der 2025 von einem Forschungsteam der University of California, Berkeley und des Georgia Institute of Technology entwickelt wurde. Ziel ist es, die Leistung großer Sprachmodelle (LLMs) in komplexen, strategischen Pokerspielen zu bewerten. Die entsprechenden Ergebnisse der Studie sind „PokerBench: Training großer Sprachmodelle zum professionellen Pokerspieler". Der Datensatz enthält 11.000 Schlüsselszenarien, aufgeteilt in 1.000 Pre-Flop- und 10.000 Post-Flop-Szenarien, die ein breites Spektrum an Spielsituationen abdecken.

Der Datensatz wurde auf Grundlage spieltheoretisch optimaler (GTO) Pokerstrategien erstellt und in Zusammenarbeit mit professionellen Pokerspielern entwickelt, um seine Vielfalt und Repräsentativität sicherzustellen. Durch die Verwendung der Tools GTOWizard und WASM-Postflop stellt der Datensatz sicher, dass die Entscheidung für jedes Szenario mit der optimalen Strategie übereinstimmt. Darüber hinaus berücksichtigt der Aufbau des Datensatzes auch die komplexen Entscheidungsbäume bei Pokerspielen und gewährleistet durch Filter- und Bereinigungsstrategien die Vollständigkeit und Effizienz der Auswertung.

Mit diesem Datensatz können Forscher die Leistung des Modells bei Pokerspielen schnell bewerten, insbesondere in Bereichen wie mathematisches Denken, strategische Planung und Vorhersage des Verhaltens des Gegners.

Datenübersicht
PokerBench.torrent
Seeding 1Downloading 0Completed 134Total Downloads 279
  • PokerBench/
    • README.md
      1.85 KB
    • README.txt
      3.7 KB
      • data/
        • poker.zip
          40.04 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp