HyperAIHyperAI
vor 2 Monaten

Audio-Superauflösung mit neuronalen Netzen

Kuleshov, Volodymyr ; Enam, S. Zayd ; Ermon, Stefano
Audio-Superauflösung mit neuronalen Netzen
Abstract

Wir stellen eine neue Audio-Verarbeitungstechnik vor, die die Abtastrate von Signalen wie Sprache oder Musik mithilfe tiefer Faltungsneuronaler Netze (deep convolutional neural networks) erhöht. Unser Modell wird anhand von Paaren aus tiefen und hochwertigen Audio-Beispielen trainiert; bei der Testphase prognostiziert es fehlende Samples innerhalb eines nieder-auflösenden Signals in einem Interpolationsprozess, der dem Bild-Super-Resolution ähnelt. Unsere Methode ist einfach und erfordert keine spezialisierten Audio-Verarbeitungstechniken; in unseren Experimenten übertrifft sie die Baseline-Methoden bei Aufskalierungsverhältnissen von 2x, 4x und 6x auf Standard-Sprach- und Musikbenchmarks. Die Methode hat praktische Anwendungen im Telephoniewesen, bei der Kompression und in der Text-zu-Sprache-Erzeugung; sie zeigt die Effektivität von feed-forward Faltungsarchitekturen bei einer Audiosyntheseaufgabe.

Audio-Superauflösung mit neuronalen Netzen | Neueste Forschungsarbeiten | HyperAI