HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات تقييم لعبة البوكر PokerBench

Date

منذ عام واحد

Size

40.04 MB

Organization

جامعة كاليفورنيا بيركلي

Publish URL

github.com

Paper URL

arxiv.org

PokerBench هي مجموعة بيانات لتقييم لعبة البوكر تم تطويرها بواسطة فريق بحثي من جامعة كاليفورنيا، بيركلي ومعهد جورجيا للتكنولوجيا في عام 2025. وتهدف إلى تقييم أداء نماذج اللغة الكبيرة (LLMs) في ألعاب البوكر المعقدة والاستراتيجية. "نتائج الورقة ذات الصلة هي"PokerBench: تدريب نماذج اللغات الكبيرة ليصبحوا لاعبي بوكر محترفينتحتوي مجموعة البيانات على 11 ألف سيناريو رئيسي، مقسمة إلى 1 ألف سيناريو قبل الدخول في اللعبة و10 آلاف سيناريو بعد الدخول في اللعبة، وتغطي مجموعة واسعة من مواقف اللعبة.

تم إنشاء مجموعة البيانات استنادًا إلى استراتيجيات البوكر المثالية من الناحية النظرية (GTO) وتم تطويرها بالتعاون مع لاعبي البوكر المحترفين لضمان تنوعها وتمثيلها. من خلال استخدام أدوات GTOWizard وWASM-Postflop، تضمن مجموعة البيانات أن القرار لكل سيناريو يتوافق مع الاستراتيجية المثلى. بالإضافة إلى ذلك، يأخذ بناء مجموعة البيانات أيضًا في الاعتبار أشجار القرار المعقدة في ألعاب البوكر، ويضمن شمولية وكفاءة التقييم من خلال استراتيجيات التصفية والتقليم.

وباستخدام هذه المجموعة من البيانات، يستطيع الباحثون تقييم أداء النموذج بسرعة في ألعاب البوكر، وخاصة في مجالات مثل التفكير الرياضي، والتخطيط الاستراتيجي، والتنبؤ بسلوك الخصم.

نظرة عامة على البيانات
PokerBench.torrent
Seeding 1Downloading 0Completed 134Total Downloads 279
  • PokerBench/
    • README.md
      1.85 KB
    • README.txt
      3.7 KB
      • data/
        • poker.zip
          40.04 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp