HyperAIHyperAI
vor 2 Monaten

Kontrapunkt durch Faltung

Cheng-Zhi Anna Huang; Tim Cooijmans; Adam Roberts; Aaron Courville; Douglas Eck
Kontrapunkt durch Faltung
Abstract

Maschinelles Lernen von Musik gliedert den Kompositionsprozess in der Regel in einen zeitlichen Ablauf ein, bei dem ein Musikstück in einem Durchgang von Anfang bis Ende komponiert wird. Im Gegensatz dazu schreiben menschliche Komponisten Musik auf nichtlineare Weise, indem sie Motive an verschiedenen Stellen notieren und häufig frühere Entscheidungen überarbeiten. Um diesen Prozess besser zu approximieren, trainieren wir ein Faltungsneuronales Netzwerk (Convolutional Neural Network), um teilweise musikalische Noten zu vervollständigen, und untersuchen die Verwendung des blockierten Gibbs-Sampling als Analogon zur Überarbeitung. Weder das Modell noch das Generierungsverfahren sind an eine bestimmte kausale Richtung der Komposition gebunden. Unser Modell ist eine Instanz des reihenfolgeunabhängigen NADE (Uria et al., 2014), was eine direktere ahnlichkeitsbasierte Stichprobenerhebung ermöglicht. Wir stellen jedoch fest, dass das Gibbs-Sampling die Qualität der Stichproben erheblich verbessert, was wir darauf zurückführen, dass einige bedingte Verteilungen schlecht modelliert werden. Darüber hinaus zeigen wir, dass sogar das kostengünstige approximative blockierte Gibbs-Verfahren von Yao et al. (2014) bessere Stichproben als die ahnlichkeitsbasierte Stichprobenerhebung liefert, sowohl auf Grundlage der Log-Likelihood als auch nach menschlicher Bewertung.请注意,"ahnlichkeitsbasierte Stichprobenerhebung" 是 "ancestral sampling" 的一种翻译方式,但为了更符合德语的学术表达习惯,通常会使用 "Ahnker Sampling" 或者直接使用英文术语 "ancestral sampling"。因此,建议将上述翻译中的 "ahnlichkeitsbasierte Stichprobenerhebung" 替换为 "Ahnker Sampling" 或者保留英文术语。修正后的翻译如下:Maschinelles Lernen von Musik gliedert den Kompositionsprozess in der Regel in einen zeitlichen Ablauf ein, bei dem ein Musikstück in einem Durchgang von Anfang bis Ende komponiert wird. Im Gegensatz dazu schreiben menschliche Komponisten Musik auf nichtlineare Weise, indem sie Motive an verschiedenen Stellen notieren und häufig frühere Entscheidungen überarbeiten. Um diesen Prozess besser zu approximieren, trainieren wir ein Faltungsneuronales Netzwerk (Convolutional Neural Network), um teilweise musikalische Noten zu vervollständigen, und untersuchen die Verwendung des blockierten Gibbs-Sampling als Analogon zur Überarbeitung. Weder das Modell noch das Generierungsverfahren sind an eine bestimmte kausale Richtung der Komposition gebunden. Unser Modell ist eine Instanz des reihenfolgeunabhängigen NADE (Uria et al., 2014), was eine direktere Ahnker Sampling ermöglicht. Wir stellen jedoch fest, dass das Gibbs-Sampling die Qualität der Stichproben erheblich verbessert, was wir darauf zurückführen, dass einige bedingte Verteilungen schlecht modelliert werden. Darüber hinaus zeigen wir, dass sogar das kostengünstige approximative blockierte Gibbs-Verfahren von Yao et al. (2014) bessere Stichproben als Ahnker Sampling liefert, sowohl auf Grundlage der Log-Likelihood als auch nach menschlicher Bewertung.

Kontrapunkt durch Faltung | Neueste Forschungsarbeiten | HyperAI