HyperAIHyperAI
vor 15 Tagen

Vortrainierung von Atmungssignalrepräsentationen mittels Metadaten und kontrastivem Lernen

Ilyass Moummad, Nicolas Farrugia
Vortrainierung von Atmungssignalrepräsentationen mittels Metadaten und kontrastivem Lernen
Abstract

Methoden auf der Basis überwachter Lernverfahren, die Annotationen end-to-end nutzen, stellen derzeit den Stand der Technik für Klassifizierungsaufgaben dar. Sie können jedoch in ihrer Generalisierungsfähigkeit eingeschränkt sein, insbesondere im Low-Data-Regime. In dieser Studie greifen wir dieses Problem mit überwachtem kontrastivem Lernen in Kombination mit verfügbaren Metadaten an, um mehrere Vor-Aufgaben zu lösen, die eine gute Datenrepräsentation erlernen. Wir wenden unseren Ansatz auf die Klassifikation von Atemgeräuschen an. Diese Aufgabe eignet sich besonders gut für dieses Setting, da demografische Informationen wie Geschlecht und Alter mit der Präsenz von Lungenerkrankungen korrelieren, und ein System, das diese Informationen implizit kodiert, möglicherweise bessere Anomalieerkennung ermöglicht. Überwachtes kontrastives Lernen ist ein Paradigma, das ähnliche Repräsentationen für Proben mit denselben Klassenlabels und unterschiedliche Repräsentationen für Proben mit verschiedenen Klassenlabels lernt. Der durch dieses Paradigma erlernte Merkmalsextraktor extrahiert nützliche Merkmale aus den Daten, und wir zeigen, dass er die Kreuzentropie bei der Klassifikation von Atemanomalien in zwei unterschiedlichen Datensätzen übertrifft. Zudem zeigen wir, dass die Lernung von Repräsentationen allein anhand von Metadaten – ohne Klassenlabels – eine vergleichbare Leistung erzielt wie die Verwendung der Kreuzentropie mit diesen Labels allein. Darüber hinaus führt die Kombination von Klassenlabels und Metadaten durch mehrfaches überwachtes kontrastives Lernen – eine Erweiterung des überwachten kontrastiven Lernens, das eine zusätzliche Aufgabe der Gruppierung von Patienten innerhalb derselben Alters- und Geschlechtsgruppe löst – zu informativeren Merkmalen. Diese Arbeit unterstreicht das Potenzial der Nutzung mehrerer Metadatenquellen in überwachten kontrastiven Lernsettings, insbesondere in Szenarien mit Klassenungleichgewicht und geringen Datenmengen. Unser Code ist unter https://github.com/ilyassmoummad/scl_icbhi2017 veröffentlicht.

Vortrainierung von Atmungssignalrepräsentationen mittels Metadaten und kontrastivem Lernen | Neueste Forschungsarbeiten | HyperAI