Search for a command to run...
Optimisation de la politique avec une distance de probabilité ponctuelle pénalisée : Une alternative à l'optimisation de la politique proximale