HyperAIHyperAI
vor 2 Monaten

SampleRNN: Ein bedingungsloses neuronales Audio-Generierungsmodell von Anfang bis Ende

Soroush Mehri; Kundan Kumar; Ishaan Gulrajani; Rithesh Kumar; Shubham Jain; Jose Sotelo; Aaron Courville; Yoshua Bengio
SampleRNN: Ein bedingungsloses neuronales Audio-Generierungsmodell von Anfang bis Ende
Abstract

In dieser Arbeit schlagen wir ein neues Modell für bedingungslose Audioerzeugung vor, das auf der sequentiellen Generierung einzelner Audiosamples basiert. Wir demonstrieren, dass unser Modell, das von der Kombination memorieloser Module, nämlich autoregressiver Multilayer-Perceptrons, und zustandsbewusster rekurrenter Neuronaler Netze in einer hierarchischen Struktur profitiert, in der Lage ist, zugrunde liegende Variationen in zeitlichen Sequenzen über sehr lange Zeiträume zu erfassen – dies wurde anhand dreier Datensätze unterschiedlicher Natur gezeigt. Eine menschliche Bewertung der generierten Samples ergab, dass unser Modell den konkurrierenden Modellen vorgezogen wird. Zudem verdeutlichen wir, wie jedes Komponente des Modells zur dargestellten Leistung beiträgt.

SampleRNN: Ein bedingungsloses neuronales Audio-Generierungsmodell von Anfang bis Ende | Neueste Forschungsarbeiten | HyperAI