HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

BYTECOVER2 : VERS UNE RÉDUCTION DE LA DIMENSIONNALITÉ DE L’EMBEDDING LATENT POUR UNE IDENTIFICATION EFFICACE DE CHANTS COUVRE

{Zejun Ma Bilei Zhu Zijie Wang Ke Chen Xingjian Du}

Résumé

Les méthodes basées sur les réseaux de neurones convolutifs (CNN) ont dominé les recherches récentes en identification de chansons couvertes (CSI). Un exemple typique est le système ByteCover que nous avons proposé, qui a atteint des résultats de pointe sur l'ensemble des principaux jeux de données utilisés pour la CSI. Dans cet article, nous proposons une version améliorée de ByteCover, appelée ByteCover2, qui améliore davantage les performances et l'efficacité de ByteCover. Contrairement à la version précédente, ByteCover2 intègre un module supplémentaire, PCA-FC, qui combine les capacités de l'analyse en composantes principales (PCA) et des réseaux de neurones à convolution complète (FC) pour réduire la dimension des embeddings audio. Cette architecture permet à ByteCover2 d'effectuer l'identification de chansons couvertes de manière plus précise et plus efficace. Nous avons évalué ByteCover2 sur plusieurs jeux de données, avec différentes tailles de dimension et différentes configurations d'entraînement, où il a surpassé tous les méthodes comparées, y compris ByteCover, même avec une taille de dimension de 128, soit 15 fois inférieure à celle de ByteCover.

Benchmarks

BenchmarkMéthodologieMétriques
cover-song-identification-on-covers80ByteCover2
MAP: 0.928
cover-song-identification-on-da-tacosByteCover2
mAP: 0.791
cover-song-identification-on-shs100k-testBytecover
mAP: 0.864

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
BYTECOVER2 : VERS UNE RÉDUCTION DE LA DIMENSIONNALITÉ DE L’EMBEDDING LATENT POUR UNE IDENTIFICATION EFFICACE DE CHANTS COUVRE | Articles de recherche | HyperAI