HyperAIHyperAI
vor 15 Tagen

Patch-Mix Contrastive Learning mit Audio-Spektrogramm-Transformer für die Klassifikation von Atmungslauten

Sangmin Bae, June-Woo Kim, Won-Yang Cho, Hyerim Baek, Soyoun Son, Byungjo Lee, Changwan Ha, Kyongpil Tae, Sungnyun Kim, Se-Young Yun
Patch-Mix Contrastive Learning mit Audio-Spektrogramm-Transformer für die Klassifikation von Atmungslauten
Abstract

Atmungssignale enthalten entscheidende Informationen für die frühzeitige Diagnose lebensbedrohlicher Lungenerkrankungen. Seit Ausbruch der COVID-19-Pandemie hat sich ein wachsender Interesse an kontaktlosen medizinischen Versorgungsformen auf Basis elektronischer Stethoskope entwickelt. Hierfür wurden fortschrittliche Deep-Learning-Modelle zur Diagnose von Lungenerkrankungen entwickelt; dennoch bleibt die Aufgabe herausfordernd aufgrund der Knappheit an medizinischen Datensätzen. In dieser Studie zeigen wir, dass ein vortrainiertes Modell, das auf großskaligen visuellen und audiosignalen Datensätzen basiert, auf die Aufgabe der Klassifikation von Atmungssignalen verallgemeinert werden kann. Darüber hinaus führen wir eine einfache Augmentierungsmethode namens Patch-Mix ein, die zufällig Patche zwischen verschiedenen Proben mischt, und integrieren diese in den Audio Spectrogram Transformer (AST). Außerdem schlagen wir ein neuartiges und effektives Patch-Mix Contrastive Learning vor, um gemischte Darstellungen im latenzraum besser unterscheiden zu können. Unser Ansatz erreicht eine state-of-the-art-Leistung auf dem ICBHI-Datensatz und übertrifft den vorherigen Spitzenwert um 4,08 %.

Patch-Mix Contrastive Learning mit Audio-Spektrogramm-Transformer für die Klassifikation von Atmungslauten | Neueste Forschungsarbeiten | HyperAI