HyperAI

Ensemble De Données De Classification Des Genres Musicaux GTZAN

Date

il y a un an

Taille

1.21 GB

Organisation

Kaggle

URL de publication

www.kaggle.com

L'ensemble de données GTZAN est l'ensemble de données public le plus couramment utilisé dans l'étude de la reconnaissance des genres musicaux (MGR) par écoute automatique. Les dossiers ont été collectés en 2000-2001 à partir de diverses sources, notamment des CD personnels, des enregistrements radio et micro.

L'ensemble de données GTZAN est un ensemble de données standard largement utilisé dans la recherche d'informations musicales, la classification musicale et d'autres tâches liées à la musique. Il contient 1000 échantillons de musique de 10 genres différents, avec 100 échantillons de chaque genre. Ces échantillons audio durent 30 secondes, sont échantillonnés à 22050 Hz et stockés au format .wav mono 16 bits. Cet ensemble de données a été créé à l'origine par le Marsyas Music Information Retrieval Toolkit et est largement utilisé pour évaluer les performances des algorithmes de classification musicale.

L'ensemble de données contient :

  • Genre original– Une collection de 10 genres, chacun avec 100 fichiers audio, tous d'une durée de 30 secondes (le célèbre jeu de données GTZAN, MNIST pour le son)
  • Image originale– Représentation visuelle de chaque fichier audio. Une façon de classer les données est d’utiliser un réseau neuronal. Étant donné que les NN (comme le CNN que nous utiliserons aujourd'hui) supposent généralement une sorte de représentation d'image, les fichiers audio sont convertis en spectrogrammes mel pour y parvenir.
  • 2 fichiers CSV– Contient les caractéristiques du fichier audio. Un fichier contient la moyenne et la variance de chaque chanson (d'une durée de 30 secondes), qui sont calculées à l'aide de plusieurs fonctionnalités pouvant être extraites des fichiers audio. L'autre fichier a la même structure, mais la chanson est divisée en fichiers audio de 3 secondes.
GTZAN.torrent
Partage 1Téléchargement 1Terminés 188Téléchargements totaux 451
  • GTZAN/
    • README.md
      2.13 KB
    • README.txt
      4.26 KB
      • data/
        • 1.zip
          1.21 GB