HyperAIHyperAI

Command Palette

Search for a command to run...

BYTECOVER2 : VERS UNE RÉDUCTION DE LA DIMENSIONNALITÉ DE L’EMBEDDING LATENT POUR UNE IDENTIFICATION EFFICACE DE CHANTS COUVRE

Zejun Ma Bilei Zhu Zijie Wang Ke Chen Xingjian Du

Résumé

Les méthodes basées sur les réseaux de neurones convolutifs (CNN) ont dominé les recherches récentes en identification de chansons couvertes (CSI). Un exemple typique est le système ByteCover que nous avons proposé, qui a atteint des résultats de pointe sur l'ensemble des principaux jeux de données utilisés pour la CSI. Dans cet article, nous proposons une version améliorée de ByteCover, appelée ByteCover2, qui améliore davantage les performances et l'efficacité de ByteCover. Contrairement à la version précédente, ByteCover2 intègre un module supplémentaire, PCA-FC, qui combine les capacités de l'analyse en composantes principales (PCA) et des réseaux de neurones à convolution complète (FC) pour réduire la dimension des embeddings audio. Cette architecture permet à ByteCover2 d'effectuer l'identification de chansons couvertes de manière plus précise et plus efficace. Nous avons évalué ByteCover2 sur plusieurs jeux de données, avec différentes tailles de dimension et différentes configurations d'entraînement, où il a surpassé tous les méthodes comparées, y compris ByteCover, même avec une taille de dimension de 128, soit 15 fois inférieure à celle de ByteCover.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
BYTECOVER2 : VERS UNE RÉDUCTION DE LA DIMENSIONNALITÉ DE L’EMBEDDING LATENT POUR UNE IDENTIFICATION EFFICACE DE CHANTS COUVRE | Articles | HyperAI