HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات تقييم لعبة البوكر PokerBench

التاريخ

منذ عام واحد

الحجم

40.04 MB

المؤسسة

جامعة كاليفورنيا بيركلي

عنوان URL للنشر

github.com

رابط الورقة البحثية

arxiv.org

PokerBench هي مجموعة بيانات لتقييم لعبة البوكر تم تطويرها بواسطة فريق بحثي من جامعة كاليفورنيا، بيركلي ومعهد جورجيا للتكنولوجيا في عام 2025. وتهدف إلى تقييم أداء نماذج اللغة الكبيرة (LLMs) في ألعاب البوكر المعقدة والاستراتيجية. "نتائج الورقة ذات الصلة هي"PokerBench: تدريب نماذج اللغات الكبيرة ليصبحوا لاعبي بوكر محترفينتحتوي مجموعة البيانات على 11 ألف سيناريو رئيسي، مقسمة إلى 1 ألف سيناريو قبل الدخول في اللعبة و10 آلاف سيناريو بعد الدخول في اللعبة، وتغطي مجموعة واسعة من مواقف اللعبة.

تم إنشاء مجموعة البيانات استنادًا إلى استراتيجيات البوكر المثالية من الناحية النظرية (GTO) وتم تطويرها بالتعاون مع لاعبي البوكر المحترفين لضمان تنوعها وتمثيلها. من خلال استخدام أدوات GTOWizard وWASM-Postflop، تضمن مجموعة البيانات أن القرار لكل سيناريو يتوافق مع الاستراتيجية المثلى. بالإضافة إلى ذلك، يأخذ بناء مجموعة البيانات أيضًا في الاعتبار أشجار القرار المعقدة في ألعاب البوكر، ويضمن شمولية وكفاءة التقييم من خلال استراتيجيات التصفية والتقليم.

وباستخدام هذه المجموعة من البيانات، يستطيع الباحثون تقييم أداء النموذج بسرعة في ألعاب البوكر، وخاصة في مجالات مثل التفكير الرياضي، والتخطيط الاستراتيجي، والتنبؤ بسلوك الخصم.

نظرة عامة على البيانات
PokerBench.torrent
البذر 1جارٍ التنزيل 0مكتمل 150إجمالي التنزيلات 288
  • PokerBench/
    • README.md
      1.85 KB
    • README.txt
      3.7 KB
      • data/
        • poker.zip
          40.04 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp