XSleepNet: Mehrfachansichtssequenzenmodell für die automatische Schlafstadieneinteilung

Die Automatisierung der Schlafstadienbestimmung ist entscheidend, um die Schlafbewertung und -diagnostik zu skalieren, um Millionen von Menschen mit Schlafmangel und -störungen zu versorgen und eine longitudinale Schlafüberwachung in häuslichen Umgebungen zu ermöglichen. Das Lernen aus rohen Polysomnografiesignalen und deren abgeleiteten Zeit-Frequenz-Bildrepräsentationen war weit verbreitet. Allerdings ist das Lernen aus mehreren Ansichten (z.B. sowohl den rohen Signalen als auch den Zeit-Frequenz-Bildern) für die Schlafstadienbestimmung schwierig und noch nicht gut verstanden. Diese Arbeit schlägt ein sequenzbasiertes Modell zur Schlafstadienbestimmung vor, XSleepNet genannt, das in der Lage ist, eine gemeinsame Repräsentation sowohl aus rohen Signalen als auch aus Zeit-Frequenz-Bildern zu lernen. Da verschiedene Ansichten unterschiedliche Verallgemeinerungs- oder Überanpassungsverhalten aufweisen können, wird das vorgeschlagene Netzwerk so trainiert, dass das Lern Tempo für jede Ansicht anhand ihres Verallgemeinerungs-/Überanpassungsverhaltens angepasst wird. Mit anderen Worten: Wenn eine bestimmte Ansicht gut verallgemeinert, wird das Lernen beschleunigt; wenn sie überangepasst wird, wird es verlangsamt. Ansichtsspezifische Verallgemeinerungs-/Überanpassungsmaße werden während des Trainings dynamisch berechnet und verwendet, um Gewichte abzuleiten, die die Gradienten von verschiedenen Ansichten mischen. Dadurch kann das Netzwerk die Repräsentationskraft verschiedener Ansichten in den gemeinsamen Merkmalen beibehalten, die die zugrunde liegende Verteilung besser repräsentieren als jene, die durch jede einzelne Ansicht alleine gelernt wurden. Darüber hinaus ist die Architektur von XSleepNet grundsätzlich darauf ausgelegt, robust gegenüber der Menge an Trainingsdaten zu sein und die Komplementarität zwischen den Eingangsansichten zu erhöhen. Experimentelle Ergebnisse an fünf Datenbanken unterschiedlicher Größen zeigen, dass XSleepNet konsistent bessere Leistungen erzielt als Single-View-Baseline-Modelle und Multi-View-Baseline-Modelle mit einer einfachen Fusionstrategie. Schließlich übertrifft XSleepNet auch frühere Methoden zur Schlafstadienbestimmung und verbessert die bisher besten Ergebnisse auf den experimentellen Datenbanken.