HyperAIHyperAI

Command Palette

Search for a command to run...

汤普森采样

Thompson Sampling是一种以William R. Thompson命名的启发式算法,旨在解决多臂赌博机问题中的探索与利用困境。该方法通过随机抽取信念来选择最大化预期奖励的动作,有效平衡了未知环境的探索与已知信息的利用,具有较高的应用价值。

暂无数据
该任务下暂无可用的基准测试数据
汤普森采样 | SOTA | HyperAI超神经