HyperAIHyperAI

Command Palette

Search for a command to run...

Imputation de données manquantes pour l'apprentissage supervisé

Jason Poulos Rafael Valle

Résumé

L'imputation de données manquantes peut aider à améliorer les performances des modèles de prédiction dans des situations où les données manquantes cachent des informations utiles. Cet article compare différentes méthodes d'imputation de données catégorielles manquantes pour des tâches de classification supervisée. Nous avons mené des expérimentations sur deux ensembles de données de référence en apprentissage automatique comportant des données catégorielles manquantes, en comparant les classifieurs formés sur des données non imputées (c'est-à-dire encodées en one-hot) ou imputées avec différents niveaux de perturbation supplémentaire due aux données manquantes. Nous montrons que les méthodes d'imputation peuvent augmenter la précision prédictive en présence de perturbations dues aux données manquantes, ce qui peut effectivement améliorer la précision des prédictions en régularisant le classifieur. Nous obtenons l'état de l'art sur l'ensemble de données Adult avec une perturbation due aux données manquantes et une imputation par les k-plus-proches-voisins (k-NN).


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Imputation de données manquantes pour l'apprentissage supervisé | Articles | HyperAI