HyperAIHyperAI
vor 2 Monaten

Musikalische Merkmale von Grund auf lernen

John Thickstun; Zaid Harchaoui; Sham Kakade
Musikalische Merkmale von Grund auf lernen
Abstract

Dieses Papier stellt einen neuen großen Musikdatensatz, MusicNet, vor, der als Quelle für die Überwachung und Bewertung von maschinellen Lernmethoden in der Musikforschung dienen soll. MusicNet besteht aus Hunderten frei lizenzierten Aufnahmen klassischer Musik von 10 Komponisten, die für 11 Instrumente komponiert wurden, zusammen mit Instrument-/Noten-Annotierungen, die zu über einer Million zeitlichen Labels auf 34 Stunden Kammermusikaufnahmen unter verschiedenen Studio- und Mikrofonbedingungen führen.Das Papier definiert eine multilabel-Klassifizierungsaufgabe zur Vorhersage von Noten in musikalischen Aufnahmen sowie ein Evaluationsprotokoll und vergleicht mehrere maschinelle Lernarchitekturen für diese Aufgabe: i) das Lernen aus Spektrogrammfeatures; ii) das end-to-end-Lernen mit einem neuronalen Netz; iii) das end-to-end-Lernen mit einem Faltungsneuronalen Netz (Convolutional Neural Net). Diese Experimente zeigen, dass end-to-end-Modelle, die für die Notenvorhersage trainiert werden, frequenzselektive Filter als niedrigstufige Audiodarstellung erlernen.