Search for a command to run...
Apprentissage au-delà de l'enseignant : distillation policy-généralisée avec extrapolation de récompense