HyperAIHyperAI
vor 8 Tagen

ÄHNLICHKEITSLERNEN ZUR COVERSONG-IDENTIFIKATION MIT HILFE VON KREUZÄHNLICHKEITSMATRIZEN MULTI-LEVEL TIEFER TIEFEN SEQUENZEN

{Xiaoou Chen, Chaoya Jiang, Deshun Yang}
Abstract

In den letzten Jahren wurden mehrere Deep-Learning-Modelle für die Identifizierung von Cover-Songs vorgeschlagen, die darauf ausgelegt sind, feste Längenvektoren für Musikstücke zu lernen. Der zeitliche Verlauf der Musik – ein entscheidender Aspekt für die Messung der Melodienähnlichkeit zwischen zwei Tracks – wird durch feste Längenvektoren jedoch nicht ausreichend repräsentiert. In diesem Paper stellen wir eine neue Siamese-Netzwerk-Architektur für das Lernen von Melodienähnlichkeitsmetriken in Musik vor. Die Architektur besteht aus zwei Komponenten: einerseits einem Netzwerk zur Lernung der tiefen Sequenzdarstellung von Musikstücken und andererseits einem Ähnlichkeitsabschätzungsnetzwerk, das die aus den tiefen Sequenzen eines Musikstückepaars berechneten Kreuz-Ähnlichkeitsmatrizen als Eingabe erhält. Beide Netzwerke werden gemeinsam trainiert und optimiert, um eine hohe Genauigkeit bei der Vorhersage der Melodienähnlichkeit zu erreichen. Experimente an mehreren öffentlichen Datensätzen belegen die Überlegenheit der vorgeschlagenen Architektur.