vor 6 Monaten

Zusammenfassung

Die Identifikation von Cover-Songs (Cover Song Identification, CSI) stellt eine herausfordernde Aufgabe und ein zentrales Thema in der Gemeinschaft der Music Information Retrieval (MIR) dar. In den letzten Jahren wurden CSI-Probleme umfassend anhand von Deep-Learning-Methoden untersucht. In diesem Artikel stellen wir einen neuartigen Ansatz für die CSI vor, der auf einer gemeinsamen Darstellungslernmethode basiert, die durch Multi-Task-Learning inspiriert ist. Konkret schlagen wir eine gemeinsame Lernstrategie vor, die Klassifikation und Metrik-Learning kombiniert, um ein Cover-Song-Modell auf Basis von WideResNet zu optimieren, das wir LyraC-Net nennen. Die Klassifikationsaufgabe lernt trennbare Embeddings verschiedener Klassen, während das Metrik-Learning die Ähnlichkeit der Embeddings durch Verkleinerung der Abstände zwischen Klassen (inter-class distance) und Vergrößerung der Trennbarkeit innerhalb der Klassen (intra-class separability) optimiert. Diese gemeinsame Optimierungsstrategie soll eine robusteren Darstellung von Cover-Songs ermöglichen als Verfahren mit einzelnen Trainingszielen. Zur Stabilisierung und Beschleunigung des Trainingsprozesses integrieren wir einen prototypischen Netzwerkansatz zusammen mit dem Triplet-Loss. Zudem führen wir SpecAugment ein, eine weit verbreitete Augmentationsmethode aus der Sprachverarbeitung, um die Leistung weiter zu verbessern. Experimentelle Ergebnisse zeigen, dass unser vorgeschlagener Ansatz vielversprechende Ergebnisse erzielt und andere neuere CSI-Methoden in den Bewertungen übertrifft.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Multi-Task-Lernen

Audio- Und Sprachverarbeitung

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Audio

Aufgabe

Tao Jiang Weifeng Zhao Lingcheng Kong Wucheng Wang Yiliang Jiang JinHong Lu Bin Zhang Shichao Hu

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Multi-Task-Lernen

Audio- Und Sprachverarbeitung

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Audio

Aufgabe

Tao Jiang Weifeng Zhao Lingcheng Kong Wucheng Wang Yiliang Jiang JinHong Lu Bin Zhang Shichao Hu

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

WideResNet mit gemeinsamer Repräsentationslernung und Datenaugmentierung für die Identifizierung von Cover-Songs

Tao Jiang Weifeng Zhao Lingcheng Kong Wucheng Wang Yiliang Jiang JinHong Lu Bin Zhang Shichao Hu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

WideResNet mit gemeinsamer Repräsentationslernung und Datenaugmentierung für die Identifizierung von Cover-Songs

Tao Jiang Weifeng Zhao Lingcheng Kong Wucheng Wang Yiliang Jiang JinHong Lu Bin Zhang Shichao Hu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

WideResNet mit gemeinsamer Repräsentationslernung und Datenaugmentierung für die Identifizierung von Cover-Songs

Tao Jiang Weifeng Zhao Lingcheng Kong Wucheng Wang Yiliang Jiang JinHong Lu Bin Zhang Shichao Hu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters