Command Palette
Search for a command to run...
Valet:传统不完全信息卡牌游戏的标准化测试平台
Valet:传统不完全信息卡牌游戏的标准化测试平台
Mark Goadrich Achille Morenville Éric Piette
摘要
针对信息不完全博弈的算法通常依据其在各单项游戏中的性能指标进行评估,这使得跨不同游戏选择的鲁棒性难以衡量。卡牌游戏因存在隐藏手牌和随机抽牌机制,是研究信息不完全博弈的自然领域。为促进信息不完全博弈算法与系统的对比研究,我们推出了 Valet——一个包含 21 款传统卡牌游戏的多样化、综合性测试平台。这些游戏横跨多种流派、文化背景、玩家人数、牌组结构、博弈机制、获胜条件以及信息隐藏与揭示方式。为实现跨系统的实现标准化,我们使用卡牌游戏描述语言 RECYCLE 对每款游戏的规则进行了形式化编码。此外,我们利用随机模拟对每款游戏的分支因子和平均时长进行了实证分析,并报告了蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)算法在与随机对手对弈时的基准得分分布,以验证 Valet 作为基准测试套件的有效性。
一句话总结
马克·古德里奇(亨德里克斯学院)与阿希尔·莫雷维尔和埃里克·皮耶特(鲁汶大学)推出了 Valet,这是一个包含 21 种多样传统纸牌游戏的标准化测试平台,所有游戏均以 RECYCLE 语言编码,支持对 MCTS 等 AI 算法在不同信息结构、分支因子和文化背景下的公平、可复现基准测试。
主要贡献
- Valet 引入了一个标准化测试平台,包含 21 种传统不完美信息纸牌游戏,均以 RECYCLE 语言编码,旨在实现跨系统的一致评估,解决 AI 研究中缺乏共享基准的问题。
- 该测试平台涵盖了多样化的游戏机制、玩家数量和信息结构,并包含对分支因子、游戏时长及基准 MCTS 与随机代理性能的实证分析,以验证其用于算法比较的适用性。
- 通过支持在不同游戏特性上的系统性评估,Valet 减少了对狭窄基准的依赖,有助于获得可复现、可推广的洞见,揭示算法性能如何与游戏设计特征相关联。
引言
作者利用不完美信息游戏 AI 中对标准化、多样化基准的需求,推出了 Valet —— 一个以 RECYCLE 语言编码的 21 种传统纸牌游戏测试平台。此前的框架如 RLCard、OpenSpiel 和 CardStock 虽提供纸牌游戏,但缺乏跨系统的一致实现,导致跨框架比较不可靠,性能主张易受游戏选择偏差影响。Valet 通过提供覆盖多个类型、玩家数量和信息机制的固定标准化规则集,支持对蒙特卡洛树搜索等算法进行更公平、可复现的评估。其对分支因子和得分分布的实证刻画进一步支持系统分析游戏结构如何影响 AI 性能。
数据集

-
作者使用 Valet 测试平台,这是一个精选的 21 种传统纸牌游戏集合,旨在代表多样化的类型、文化起源和历史发展,同时优先选择规则较简单的游戏。他们排除了广泛研究的商业或复杂游戏(如 BRIDGE 或 TEXAS HOLD’EM),转而采用基础变体如 WHIST、KLAVERJASSEN 和 LEDUC HOLD’EM。
-
该数据集涵盖四大主要游戏类别:
• 技巧型游戏(8 种):AGRAM、WHIST、EUCHRE、SUECA、HEARTS、PITCH、KLAVERJASSEN、SCARTO —— 在王牌规则、计分和搭档机制上各不相同。
• 手牌管理/弃牌型游戏(5 种):CRAZY EIGHTS、PRESIDENT、GO FISH、RUMMY、SKITGUBBE —— 从匹配机制到策略规划均有涉及。
• 手牌比较/交换型游戏(4 种):BLACKJACK、LEDUC HOLD’EM、CUCKOO、SCHWIMMEN —— 包含类似下注的决策或手牌交换机制。
• 其他类型(4 种):GOOFSPIEL、SCOPA、GOLF-6、CRIBBAGE —— 引入同步行动、捕获、隐藏所有权或多阶段计分等机制。 -
游戏源自 12 个国家,使用不同牌组:
• 标准 52 张法式牌组(最常见)。
• 78 张塔罗牌组(SCARTO)。
• 40 张西班牙/意大利牌组(SUECA、SCOPA)。
• 简化法式牌组(如 AGRAM、EUCHRE、KLAVERJASSEN、SCHWIMMEN)。
• 6 张迷你牌组(LEDUC HOLD’EM)。 -
为确保一致性,所有游戏均以 RECYCLE 语言编码以实现标准化规则实现。多数游戏限制为单轮,以简化 AI 决策空间;CRIBBAGE 包含两轮以平衡庄家优势。特定规则变体的选择以可玩性和清晰性为优先 —— 例如,美式 Euchre 不含小丑牌,HEARTS/SCARTO 不允许传牌,简化版 BLACKJACK 含保险但无分牌,Block Rummy 在抽牌堆空时结束,CRAZY EIGHTS 强制出牌。GOOFSPIEL 中的平局顺延至下一轮。
实验
- 实验通过随机代理和 MCTS 代理的模拟,评估了 Valet 中游戏的多样性和决策复杂度,确认了在信息流、分支因子、游戏时长和得分分布上的显著差异。
- 信息流差异显著:游戏在公开、私有和隐藏信息的管理方式上各不相同,部分游戏使用多张背面或共享私有信息(如 Cribbage 中的“暗牌”),而基于推理的提示(如技巧型游戏)则保持隐含。
- 分支因子分析显示,多数游戏复杂度适中,但 Go Fish、President、Skitgubbe 和 Scarto 因游戏机制表现出更高复杂度;技巧型游戏共享一致模式,后手玩家选择受限。
- 游戏时长差异较大,Rummy 和 Skitgubbe 因随机代理偏好低影响动作而显著更长;多数游戏在 10–100 个决策点之间,技巧型游戏通常为固定长度。
- 得分分布差异明显:Klaaverjassen 跨度宽广,Agram 和 Cuckoo 产生二元结果;MCTS 在多数游戏中优于随机玩法,但在 Cuckoo 中因先手优势有限而表现不佳,Go Fish/Crazy Eights 因缺乏动作历史建模而提升甚微。