Search for a command to run...
Sur la non-linéarité de la loi d'échelle du taux d'apprentissage pour l'entraînement des LLM