Einfluss der Vielfalt von EKG-Datensätzen auf die Generalisierbarkeit eines CNN-Modells zur Erkennung des QRS-Komplexes
Die Detektion von QRS-Komplexen in elektrokardiographischen (ECG-)Signalen ist entscheidend für die automatisierte kardiale Diagnose. Die automatisierte QRS-Detektion ist bereits über drei Jahrzehnte ein Forschungsthema, und mehrere traditionelle QRS-Detektionsmethoden zeigen akzeptable Detektionsgenauigkeit. Die Anwendbarkeit dieser Methoden jenseits ihrer spezifischen Untersuchungsdatenbanken wurde jedoch nicht ausreichend untersucht. Die nicht-stationäre Natur des ECG-Signals sowie die Varianz innerhalb und zwischen Patientenpräparaten stellen erhebliche Herausforderungen für einzelne QRS-Detektoren dar, um eine vernünftige Leistung zu erzielen. In der Praxis sollte ein vielversprechender QRS-Detektor eine akzeptable Genauigkeit über eine Vielzahl unterschiedlicher ECG-Aufzeichnungen erreichen, weshalb die Untersuchung der Generalisierungsfähigkeit des Modells von zentraler Bedeutung ist. Diese Arbeit untersucht die Generalisierungsfähigkeit von convolutional neural network (CNN)-basierten Modellen sowohl aus intra-individueller Sicht (subject-wise Leave-One-Out- sowie Fünf-Feld-Quervalidierung) als auch aus inter-datenbanklicher Perspektive (Training mit einer oder mehreren Datensätze) an drei öffentlich verfügbaren ECG-Datenbanken: MIT-BIH Arrhythmia, INCART und QT. Die Leave-One-Out-Testgenauigkeiten betragen jeweils 99,22 %, 97,13 % und 96,25 % für diese Datenbanken. Die inter-datenbanken Tests zeigen eine Genauigkeit von über 90 %, mit der einzigen Ausnahme von INCART. Die beobachtete Leistungsvariation verdeutlicht, dass die Generalisierungsfähigkeit eines CNN-Modells nicht einfach durch die Hinzufügung weiterer Trainingsbeispiele verbessert wird, sondern vielmehr die Aufnahme von Daten aus einer vielfältigen Palette von Probanden notwendig ist, um eine angemessene QRS-Detektionsgenauigkeit zu erreichen.