Système de transcription de musique pour piano polyphonique exploitant les corrélations mutuelles entre différents états de notes musicales
En général, les systèmes de transcription de musique pianistique polyphonique sont conçus pour estimer et déterminer les activités de hauteur ainsi que les différents états des notes pour chaque trame audio. Bien que ces systèmes de transcription aient plusieurs applications dans le domaine de la récupération d'information musicale (MIR), la prédiction précise des différents états des notes reste un défi considérable en raison de la complexité structurelle des événements musicaux. Par conséquent, les approches visant à concevoir des architectures de réseaux neuronaux se sont progressivement développées afin de faciliter la prédiction conjointe de chaque état de note. Toutefois, les modèles récents n’ont pas encore réussi à exploiter efficacement les corrélations mutuelles entre les différents états des notes. La contribution principale de notre travail réside dans la vérification de ces corrélations mutuelles entre les états des notes, ainsi que dans leur intégration explicite dans l’architecture du modèle. Cela permet au système de transcription de reconnaître des événements de note plus nets et de produire des résultats de haute qualité dans des contextes réels. Nous proposons un module d’extraction de caractéristiques partageant des noyaux (kernel-sharing feature extractor) pour exploiter ces corrélations mutuelles dès l’étape d’extraction des caractéristiques. En outre, afin de permettre au système de mieux reconnaître la forme de l’enveloppe de hauteur, nous avons ajouté des connexions spécifiques entre les modules détecteurs dédiés à chaque état de note, au cours de l’étape de détection des états. L’efficacité de notre architecture a été rigoureusement validée à travers une série d’expériences utilisant le jeu de données MAESTRO, publiquement disponible et proposé par Google Magenta. En outre, des études d’ablation ont été menées afin de démontrer l’importance des corrélations mutuelles et de mettre en évidence l’impact et la pertinence de l’approche proposée.