HyperAIHyperAI

Bandits Multi-bras

Le problème du bandit manchot multi-bras concerne l'optimisation des récompenses attendues en répartissant des ressources limitées entre plusieurs options concurrentes. Au cœur de cette tâche se trouve le compromis entre exploration et exploitation, qui présente une valeur théorique et pratique importante, avec des applications variées dans la publicité en ligne, l'optimisation des systèmes de recommandation et d'autres domaines.