HyperAI

Augmentation Des Données

L'augmentation des données est une technique qui augmente artificiellement l'ensemble d'entraînement en créant une copie modifiée de l'ensemble de données à l'aide de données existantes., qui est l’une des techniques couramment utilisées dans l’apprentissage en profondeur, consiste à apporter de petites modifications à l’ensemble de données ou à utiliser l’apprentissage en profondeur pour générer de nouveaux points de données. L'augmentation des données est principalement utilisée pour augmenter l'ensemble de données d'entraînement et rendre l'ensemble de données aussi diversifié que possible afin que le modèle entraîné ait une capacité de généralisation plus forte. Tous les principaux cadres d’apprentissage profond existants sont déjà dotés d’une augmentation des données.

Scénarios d'utilisation de l'augmentation des données

  1. Empêcher le surapprentissage du modèle.
  2. L'ensemble d'entraînement initial est trop petit.
  3. Pour améliorer la précision du modèle.
  4. Réduisez les coûts opérationnels d’étiquetage et de nettoyage des ensembles de données brutes. 

Limites de l'augmentation des données

  • Les biais présents dans l’ensemble de données d’origine sont toujours présents dans les données augmentées.
  • L’assurance qualité pour l’augmentation des données est coûteuse. 
  • La recherche et le développement sont nécessaires pour construire des systèmes avec des applications avancées. Par exemple, générer des images haute résolution à l’aide de GAN peut être difficile.
  • Trouver des méthodes efficaces d’augmentation des données peut s’avérer difficile.