RespireNet: Ein tiefes neuronales Netzwerk zur präzisen Erkennung von abnormen Atemgeräuschen in datenarmen Umgebungen

Die Auskultation respiratorischer Geräusche stellt das wichtigste Instrument zur Vorsorgeuntersuchung und Diagnose von Lungenerkrankungen dar. Eine automatisierte Analyse in Kombination mit digitalen Stethoskopen kann eine entscheidende Rolle bei der Tele-Vorsorgeuntersuchung lebensbedrohlicher Lungenerkrankungen spielen. Tiefgehende neuronale Netze (DNNs) haben bei solchen Aufgaben großes Potenzial gezeigt und sind daher eine naheliegende Wahl. Allerdings sind DNNs äußerst datenintensiv, und der größte verfügbare respiratorische Datensatz, ICBHI, umfasst lediglich 6898 Atemzyklen – was für die Schulung eines zufriedenstellenden DNN-Modells nach wie vor zu klein ist. In dieser Arbeit stellen wir RespireNet vor, ein einfaches CNN-basiertes Modell, ergänzt durch eine Reihe neuartiger Techniken – gerätespezifisches Feinabstimmen, augmentationsbasierte Verkettung, Ausschneiden leerer Regionen sowie intelligente Auffüllung –, die es uns ermöglichen, den kleinen Datensatz effizient zu nutzen. Wir führen eine umfassende Evaluation auf dem ICBHI-Datensatz durch und erreichen gegenüber den bisher besten Ergebnissen für die 4-Klassen-Klassifikation eine Verbesserung um 2,2 %.