HyperAIHyperAI
il y a 2 mois

Sélection de caractéristiques basée sur la courbure avec application à la classification des dossiers médicaux électroniques

Zheming Zuo; Jie Li; Han Xu; Noura Al Moubayed
Sélection de caractéristiques basée sur la courbure avec application à la classification des dossiers médicaux électroniques
Résumé

Les technologies disruptives offrent des opportunités sans équivalent pour contribuer à l'identification de nombreux aspects dans les soins de santé omniprésents, depuis l'adoption de l'Internet des Objets jusqu'à l'utilisation de techniques d'apprentissage automatique (Machine Learning, ML). En tant qu'outil puissant, le ML est largement appliqué dans les solutions de soins de santé centrées sur le patient. Pour améliorer encore la qualité des soins aux patients, les Dossiers Médicaux Électroniques (DME) sont couramment utilisés dans les établissements de santé pour l'analyse. Il est une tâche cruciale d'appliquer l'intelligence artificielle (IA) et le ML pour analyser ces DME en vue de prédictions et diagnostics, en raison de leur nature hautement non structurée, déséquilibrée, incomplète et multidimensionnelle. La réduction de dimensionnalité est une technique courante de prétraitement des données utilisée pour gérer les données DME à haute dimensionnalité. Elle vise à réduire le nombre de caractéristiques de la représentation des DME tout en améliorant la performance des analyses ultérieures des données, par exemple la classification.Dans cette étude, une méthode efficace de sélection de caractéristiques basée sur un filtre, nommée Sélection de Caractéristiques Basée sur la Courbure (Curvature-based Feature Selection, CFS), est présentée. La CFS proposée utilise le concept de courbure de Menger pour classer les poids de toutes les caractéristiques du jeu de données donné. Les performances de la CFS proposée ont été évaluées sur quatre jeux de données DME bien connus, incluant les Facteurs de Risque du Cancer du Col utérin (Cervical Cancer Risk Factors Data Set, CCRFDS), le Cancer du Sein Coimbra (Breast Cancer Coimbra Data Set, BCCDS), le Tissu Mammaire (Breast Tissue Data Set, BTDS) et la Rétinopathie Diabétique Debrecen (Diabetic Retinopathy Debrecen Data Set, DRDDS). Les résultats expérimentaux montrent que la CFS proposée a atteint des performances au niveau d'état de l'art sur ces jeux de données par rapport aux méthodes conventionnelles comme l'AFC (Analyse en Composantes Principales) et aux autres approches les plus récentes. Le code source de l'approche proposée est disponible publiquement à l'adresse suivante : https://github.com/zhemingzuo/CFS.

Sélection de caractéristiques basée sur la courbure avec application à la classification des dossiers médicaux électroniques | Articles de recherche récents | HyperAI