HyperAIHyperAI
il y a 17 jours

Transcription Piano à Haute Résolution avec Pédaliers en Régressant les Temps d'Onset et d'Offset

Qiuqiang Kong, Bochen Li, Xuchen Song, Yuan Wan, Yuxuan Wang
Transcription Piano à Haute Résolution avec Pédaliers en Régressant les Temps d'Onset et d'Offset
Résumé

La transcription automatique de musique (AMT) consiste à convertir des enregistrements audio en représentations symboliques. Récemment, des méthodes fondées sur les réseaux de neurones ont été appliquées à l’AMT et ont atteint des résultats de pointe. Toutefois, de nombreux systèmes antérieurs ne détectent que l’instauration et la fin des notes au niveau des trames, ce qui limite la résolution de la transcription à la taille du pas entre trames. Il existe un manque de recherches sur l’utilisation de différentes stratégies pour encoder les cibles d’instauration et de fin des notes lors de l’entraînement. En outre, les systèmes d’AMT antérieurs sont sensibles aux étiquettes mal alignées d’instauration et de fin présentes dans les enregistrements audio. Par ailleurs, les travaux portant sur la transcription de la pédale de sustain sur des jeux de données à grande échelle restent limités. Dans cet article, nous proposons un système d’AMT à haute résolution entraîné par régression des instaurations et fins précises des notes de piano. En phase d’inférence, nous introduisons un algorithme permettant de calculer analytiquement les instaurations et fins précises des notes de piano ainsi que des événements de pédale. Nous démontrons que notre système d’AMT est plus robuste aux étiquettes mal alignées d’instauration et de fin que les systèmes antérieurs. Notre approche atteint un score F1 d’instauration de 96,72 % sur le jeu de données MAESTRO, surpassant ainsi le système précédent basé sur les instaurations et les trames (94,80 %). De plus, elle obtient un score F1 d’instauration de pédale de 91,86 %, constituant ainsi la première référence sur le jeu de données MAESTRO. Nous avons rendu disponibles le code source et les points de contrôle de notre travail à l’adresse suivante : https://github.com/bytedance/piano_transcription.