HyperAIHyperAI
il y a 2 mois

Identification précise et évolutique des versions utilisant des plongements motivés musicalement

Furkan Yesiler; Joan Serrà; Emilia Gómez
Identification précise et évolutique des versions utilisant des plongements motivés musicalement
Résumé

La tâche d'identification de versions (VI) concerne la détection automatique des enregistrements correspondant à la même œuvre musicale sous-jacente. Malgré de nombreux efforts, l'identification de versions reste un problème ouvert, avec beaucoup de marges de progression, en particulier en ce qui concerne la combinaison de précision et d'évolutivité. Dans cet article, nous présentons MOVE, une méthode motivée musicalement pour une identification de versions précise et évolutible. MOVE atteint des performances de pointe sur deux ensembles de référence publiquement disponibles en apprenant des plongements évolutifs dans un espace de distance euclidienne, en utilisant une perte par triplet et une stratégie d'extraction de triplets difficiles. Elle améliore les travaux précédents grâce à l'utilisation d'une représentation alternative des entrées, à l'introduction d'une nouvelle technique pour le résumé du contenu temporel, à un espace latent standardisé et à une stratégie d'augmentation de données spécifiquement conçue pour l'identification de versions (VI). Outre les résultats principaux, nous menons une étude par élimination progressive (ablation study) pour souligner l'importance de nos choix conceptuels et étudions la relation entre la dimensionalité des plongements et les performances du modèle.