HyperAIHyperAI
il y a 2 mois

Modélisation de données tabulaires à l'aide de GAN conditionnelles

Lei Xu; Maria Skoularidou; Alfredo Cuesta-Infante; Kalyan Veeramachaneni
Modélisation de données tabulaires à l'aide de GAN conditionnelles
Résumé

Modéliser la distribution de probabilité des lignes dans les données tabulaires et générer des données synthétiques réalistes est une tâche non triviale. Les données tabulaires contiennent généralement un mélange de colonnes discrètes et continues. Les colonnes continues peuvent présenter plusieurs modes, tandis que les colonnes discrètes sont parfois déséquilibrées, ce qui rend la modélisation difficile. Les modèles statistiques et les réseaux neuronaux profonds existants échouent à modéliser correctement ce type de données. Nous avons conçu TGAN, qui utilise un réseau génératif adversarial conditionnel pour relever ces défis. Pour faciliter une comparaison équitable et approfondie, nous avons élaboré un banc d'essai comprenant 7 jeux de données simulés et 8 jeux de données réels, ainsi que plusieurs méthodes de base basées sur les réseaux bayésiens. TGAN surpasse les méthodes bayésiennes sur la plupart des jeux de données réels, alors que d'autres méthodes d'apprentissage profond n'y sont pas parvenues.

Modélisation de données tabulaires à l'aide de GAN conditionnelles | Articles de recherche récents | HyperAI