Quantification
La quantification est une technique prometteuse visant à réduire le coût computationnel de l'entraînement des réseaux de neurones et à améliorer l'efficacité des modèles et l'utilisation des ressources en utilisant des nombres à virgule fixe à faible coût (comme int8/int16) pour remplacer les nombres à virgule flottante à haut coût (comme float32). Cette technique est particulièrement adaptée aux applications de deep learning à grande échelle.