HyperAIHyperAI
il y a 2 mois

Ne sous-estimez pas l'apprentissage automatique traditionnel : des techniques simples et interprétables sont compétitives par rapport à l'apprentissage profond pour le scoring du sommeil.

Jeroen Van Der Donckt; Jonas Van Der Donckt; Emiel Deprost; Nicolas Vandenbussche; Michael Rademaker; Gilles Vandewiele; Sofie Van Hoecke
Ne sous-estimez pas l'apprentissage automatique traditionnel : des techniques simples et interprétables sont compétitives par rapport à l'apprentissage profond pour le scoring du sommeil.
Résumé

Au cours des dernières années, les recherches en matière de notation automatique du sommeil se sont principalement concentrées sur le développement d'architectures d'apprentissage profond de plus en plus complexes. Cependant, ces approches ont récemment permis des améliorations marginales, souvent au détriment d'une nécessité accrue de données et de procédures d'entraînement plus coûteuses. Malgré tous ces efforts et leurs performances satisfaisantes, les solutions de stades de sommeil automatiques ne sont pas encore largement adoptées dans un contexte clinique. Nous soutenons que la plupart des solutions d'apprentissage profond pour la notation du sommeil sont limitées dans leur applicabilité réelle car elles sont difficiles à entraîner, à déployer et à reproduire. De plus, ces solutions manquent d'interprétabilité et de transparence, éléments souvent essentiels pour augmenter les taux d'adoption. Dans cette étude, nous reprenons le problème de la classification des stades de sommeil en utilisant l'apprentissage automatique classique. Les résultats montrent qu'une performance compétitive peut être atteinte avec une pipeline d'apprentissage automatique conventionnelle comprenant un prétraitement, une extraction de caractéristiques et un modèle d'apprentissage automatique simple. En particulier, nous analysons la performance d'un modèle linéaire et d'un modèle non-linéaire (gradient boosting). Notre approche dépasse l'état de l'art (utilisant les mêmes données) sur deux jeux de données publics : Sleep-EDF SC-20 (MF1 0,810) et Sleep-EDF ST (MF1 0,795), tout en obtenant des résultats compétitifs sur Sleep-EDF SC-78 (MF1 0,775) et MASS SS3 (MF1 0,817). Nous montrons que, pour la tâche de notation des stades de sommeil, l'expressivité d'un vecteur de caractéristiques conçu est comparable aux représentations internes apprises par les modèles d'apprentissage profond. Cette observation ouvre la voie à l'adoption clinique, car un vecteur de caractéristiques représentatif permet d'utiliser à la fois l'interprétabilité et le bilan positif des modèles traditionnels d'apprentissage automatique.