HyperAIHyperAI

Command Palette

Search for a command to run...

RCT: Random Consistency Training für semi-supervised Sound Event Detection

Nian Shao Erfan Loweimi Xiaofei Li

Zusammenfassung

Die Sound-Event-Detection (SED), als zentrales Modul der akustischen Umweltanalyse, leidet unter dem Problem des Datenmangels. Die Integration von semi-supervised Learning (SSL) mindert dieses Problem erheblich, ohne zusätzlichen Annotationenaufwand zu erfordern. In dieser Arbeit werden mehrere zentrale Module von SSL untersucht, und es wird eine zufällige Konsistenztraining-(RCT)-Strategie vorgestellt. Zunächst wird eine Selbstkonsistenzverlustfunktion vorgeschlagen, die mit dem Lehrer-Schüler-Modell kombiniert wird, um den Trainingsprozess zu stabilisieren. Zweitens wird eine harte Mixup-Datenaugmentation eingeführt, um die additiven Eigenschaften von Schallereignissen angemessen zu berücksichtigen. Drittens wird ein zufälliges Augmentationsverfahren angewendet, um flexibel verschiedene Arten von Datenaugmentierungen zu kombinieren. Experimente zeigen, dass die vorgeschlagene Strategie andere weit verbreitete Ansätze übertrifft.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
RCT: Random Consistency Training für semi-supervised Sound Event Detection | Paper | HyperAI