HyperAI
Command Palette
Search for a command to run...
汤普森采样
Thompson Sampling是一种以William R. Thompson命名的启发式算法,旨在解决多臂赌博机问题中的探索与利用困境。该方法通过随机抽取信念来选择最大化预期奖励的动作,有效平衡了未知环境的探索与已知信息的利用,具有较高的应用价值。
暂无数据
该任务下暂无可用的基准测试数据
Search for a command to run...
Thompson Sampling是一种以William R. Thompson命名的启发式算法,旨在解决多臂赌博机问题中的探索与利用困境。该方法通过随机抽取信念来选择最大化预期奖励的动作,有效平衡了未知环境的探索与已知信息的利用,具有较高的应用价值。