Impact de la diversité des jeux de données ECG sur la généralisation du modèle CNN pour la détection du complexe QRS
La détection des complexes QRS dans les signaux d’électrocardiogramme (ECG) est essentielle pour le diagnostic cardiaque automatisé. La détection automatisée des complexes QRS fait l’objet de recherches depuis plus de trois décennies, et plusieurs méthodes classiques ont démontré une précision acceptable. Toutefois, leur applicabilité au-delà des bases de données spécifiques à chaque étude n’a pas été suffisamment explorée. La nature non stationnaire des signaux ECG, ainsi que les variations intra- et inter-individuelles, posent des défis importants aux détecteurs uniques de complexes QRS, limitant leur performance raisonnable. En pratique, un détecteur de QRS prometteur devrait atteindre une précision acceptable sur une large variété de signaux ECG ; il est donc crucial d’évaluer la capacité de généralisation du modèle. Ce travail étudie la capacité de généralisation des modèles basés sur les réseaux de neurones convolutifs (CNN) sous deux angles : intra-sujet (validation croisée à cinq plis et méthode leave-one-out par sujet) et inter-base de données (entraînement sur une ou plusieurs bases de données), sur trois bases de données ECG publiques : MIT-BIH Arrhythmia, INCART et QT. Les taux de précision obtenus lors des tests leave-one-out atteignent respectivement 99,22 %, 97,13 % et 96,25 %. Les tests inter-base de données montrent une précision supérieure à 90 %, avec une seule exception notable pour INCART. La variation des performances met en évidence le fait que l’ajout de plus d’échantillons d’entraînement ne garantit pas automatiquement une meilleure capacité de généralisation du modèle CNN ; il est en réalité nécessaire d’intégrer des échantillons provenant d’un large éventail de sujets pour assurer une précision raisonnable dans la détection des complexes QRS.