vor 8 Monaten

Zusammenfassung

Automatische Musiktranskription (AMT), die Inferenz von Noten aus Rohaudio, ist eine anspruchsvolle Aufgabe im Zentrum der Musikauswertung. Im Gegensatz zur automatischen Spracherkennung (ASR), die sich in der Regel auf die Worte eines einzelnen Sprechers konzentriert, erfordert AMT häufig das gleichzeitige Transkribieren mehrerer Instrumente, wobei fein skalierte Tonhöhen- und Timinginformationen erhalten bleiben müssen. Darüber hinaus sind viele AMT-Datensätze „ressourcenarm“, da sogar Expertenmusiker die Transkription von Musik schwierig und zeitaufwendig finden. Daher haben frühere Arbeiten sich auf taskspezifische Architekturen konzentriert, die für die jeweiligen Instrumente jeder Aufgabe angepasst wurden. In dieser Arbeit, inspiriert durch die vielversprechenden Ergebnisse des sequenzbasierten Transferlearnings für ressourcenarme Natürliche Sprachverarbeitung (NLP), zeigen wir, dass ein allgemeiner Transformer-Modell den Multi-Task-AMT durchführen kann, indem es beliebige Kombinationen von Musikinstrumenten über mehrere Transkriptionsdatensätze hinweg gemeinsam transkribiert. Wir demonstrieren, dass dieses einheitliche Trainingsframework hochwertige Transkriptionsergebnisse über einen breiten Spektrum an Datensätzen erzielt, die Leistung für ressourcenarme Instrumente (wie Gitarre) dramatisch verbessert und gleichzeitig starke Leistungen für reichhaltige Instrumente (wie Klavier) beibehält. Schließlich erweitern wir den Umfang der AMT und legen damit das Bedürfnis nach konsistenten Evaluationsmetriken und besserer Datensatzausrichtung frei, und wir stellen eine starke Baseline für diese neue Richtung des Multi-Task-AMT bereit.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Multi-Task-Lernen

Transformer

Audio- Und Sprachverarbeitung

Ansatz/Rahmenwerk

Audio

Aufgabe

Josh Gardner Ian Simon Ethan Manilow Curtis Hawthorne Jesse Engel

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Multi-Task-Lernen

Transformer

Audio- Und Sprachverarbeitung

Ansatz/Rahmenwerk

Audio

Aufgabe

Josh Gardner Ian Simon Ethan Manilow Curtis Hawthorne Jesse Engel

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

MT3: Mehrfach-Aufgaben Mehrspur-Musiktranskription

Josh Gardner Ian Simon Ethan Manilow Curtis Hawthorne Jesse Engel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MT3: Mehrfach-Aufgaben Mehrspur-Musiktranskription

Josh Gardner Ian Simon Ethan Manilow Curtis Hawthorne Jesse Engel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MT3: Mehrfach-Aufgaben Mehrspur-Musiktranskription

Josh Gardner Ian Simon Ethan Manilow Curtis Hawthorne Jesse Engel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters