HyperAI
Command Palette
Search for a command to run...
トンプソンサンプリング
トンプソンサンプリングは、ウィリアム・R・トンプソンにちなんで名付けられたヒューリスティックアルゴリズムで、多腕バンディット問題における探索と活用のジレンマを解決するために設計されています。この方法は、信念からランダムにサンプリングすることで期待報酬を最大化するアクションを選択し、未知の環境の探索と既知の情報の活用を効果的にバランスさせます。そのため、実際の応用において非常に価値があります。
データなし
このタスクで利用可能なベンチマークデータがありません