HyperAI
Command Palette
Search for a command to run...
分布強化学習
ディストリビューショナル強化学習は、確率的な報酬 Z の分布に焦点を当て、その期待値 Q ではなく分布自体を扱う強化学習手法です。報酬分布の特性を再帰的に説明することで、このアプローチはリスクに配慮した行動を達成し、意思決定の堅牢性と適応性を向上させます。複雑な環境では、この方法がエージェントが不確実性をよりよく理解し、対処できるように助け、長期的な報酬を最適化します。
データなし
このタスクで利用可能なベンチマークデータがありません