HyperAIHyperAI

Command Palette

Search for a command to run...

Transcription Piano à Haute Résolution avec Pédaliers en Régressant les Temps d'Onset et d'Offset

Qiuqiang Kong Bochen Li Xuchen Song Yuan Wan Yuxuan Wang

Résumé

La transcription automatique de musique (AMT) consiste à convertir des enregistrements audio en représentations symboliques. Récemment, des méthodes fondées sur les réseaux de neurones ont été appliquées à l’AMT et ont atteint des résultats de pointe. Toutefois, de nombreux systèmes antérieurs ne détectent que l’instauration et la fin des notes au niveau des trames, ce qui limite la résolution de la transcription à la taille du pas entre trames. Il existe un manque de recherches sur l’utilisation de différentes stratégies pour encoder les cibles d’instauration et de fin des notes lors de l’entraînement. En outre, les systèmes d’AMT antérieurs sont sensibles aux étiquettes mal alignées d’instauration et de fin présentes dans les enregistrements audio. Par ailleurs, les travaux portant sur la transcription de la pédale de sustain sur des jeux de données à grande échelle restent limités. Dans cet article, nous proposons un système d’AMT à haute résolution entraîné par régression des instaurations et fins précises des notes de piano. En phase d’inférence, nous introduisons un algorithme permettant de calculer analytiquement les instaurations et fins précises des notes de piano ainsi que des événements de pédale. Nous démontrons que notre système d’AMT est plus robuste aux étiquettes mal alignées d’instauration et de fin que les systèmes antérieurs. Notre approche atteint un score F1 d’instauration de 96,72 % sur le jeu de données MAESTRO, surpassant ainsi le système précédent basé sur les instaurations et les trames (94,80 %). De plus, elle obtient un score F1 d’instauration de pédale de 91,86 %, constituant ainsi la première référence sur le jeu de données MAESTRO. Nous avons rendu disponibles le code source et les points de contrôle de notre travail à l’adresse suivante : https://github.com/bytedance/piano_transcription.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Transcription Piano à Haute Résolution avec Pédaliers en Régressant les Temps d'Onset et d'Offset | Articles | HyperAI