HyperAIHyperAI
il y a 2 mois

ByteCover3 : Identification précise des reprises sur requêtes courtes

Xingjian Du; Zijie Wang; Xia Liang; Huidong Liang; Bilei Zhu; Zejun Ma
ByteCover3 : Identification précise des reprises sur requêtes courtes
Résumé

Les méthodes basées sur l'apprentissage profond sont devenues un paradigme pour l'identification des reprises musicales (CSI) ces dernières années, où les systèmes ByteCover ont obtenu des résultats d'état de l'art sur tous les ensembles de données principaux de CSI. Cependant, avec l'émergence des vidéos courtes, de nombreuses applications réelles nécessitent la correspondance d'extraites musicales courtes avec des pistes musicales complètes dans la base de données, un domaine encore peu exploré et qui attend une solution à niveau industriel. Dans cet article, nous améliorons les systèmes ByteCover précédents pour créer ByteCover3, qui utilise des caractéristiques locales afin d'améliorer davantage les performances d'identification des requêtes musicales courtes. ByteCover3 est conçu avec un module de perte d'alignement local (LAL) et une pipeline de recherche de caractéristiques en deux étapes, permettant au système d'effectuer l'identification des reprises musicales (CSI) de manière plus précise et efficace. Nous avons évalué ByteCover3 sur plusieurs ensembles de données avec différentes configurations de référence, où ByteCover3 a surpassé toutes les méthodes comparées, y compris ses versions précédentes.