HyperAI

Choix Hebdomadaires De L'éditeur | L'ensemble De Données Musicales CCMusic Est En Ligne, Révélant Le Grand Modèle ChipNeMo Développé Par NVIDIA

特色图像

Afin de rendre l’IA plus efficace dans la formation musicale,CCMusic a ouvert certains ensembles de données musicales et audio à l'usage gratuit des chercheurs en musicologie computationnelle.Désormais disponible sur hyper.ai. De plus, hyper.ai a également mis à jour des ensembles de données musicales pertinents tels que miHoYo et NetEase Cloud Music. Jetons un oeil !

Du 22 au 26 janvier, le site officiel de hyper.ai a été mis à jour rapidement :

* Ensembles de données publiques de haute qualité : 10

* Étuis en papier AI4S : 2

* Entrées d'encyclopédie populaire : 10

Visitez le site officiel :hyper.ai

Ensembles de données publiques sélectionnés

1Ensemble de données vocales vraies et fausses CCMUSIC

Cet ensemble de données contient 1280 audios de chant monophonique (format .wav) en voix de poitrine et en falsetto. La voix de poitrine est marquée comme voix de poitrine et le falsetto est marqué comme falsetto.

Utilisation directe :

https://hyper.ai/datasets/29125

2. Ensemble de données sur la qualité sonore du piano CCMUSIC

Cet ensemble de données contient 12 fichiers audio de gamme (format .wav / .mp3 / .m4a) et 1320 fichiers audio segmentés à un seul ton (format .wav / .mp3 / .m4a) de 7 types de pianos dans la salle de piano du Conservatoire de musique de Chine (piano droit Kawai, piano à queue Kawai, piano droit Yongchang, piano droit Xinghai, piano à queue Steinway Grand Theater, piano à queue Steinway et piano droit Pearl River), totalisant 1332 fichiers. De plus, il existe un questionnaire d'évaluation subjective de la qualité sonore du piano (format .xls), qui comprend les scores de 29 participants à l'évaluation subjective de la qualité sonore du piano.

Utilisation directe :

https://hyper.ai/datasets/29097

3. Ensemble de données sur les genres musicaux CCMUSIC

L'ensemble de données contient environ 1700 morceaux de musique (format .mp3), d'une durée de 270 à 300 secondes, répartis en 17 genres au total. En raison de problèmes de droits d'auteur de la musique originale, seuls les spectrogrammes sont fournis dans l'ensemble de données.

Utilisation directe :

https://hyper.ai/datasets/29094

4. Ensemble de données nationales sur le chant Bel Canto de CCMUSIC

Cet ensemble de données contient des centaines d'enregistrements a cappella chantés par des chanteurs professionnels dans deux styles : Bel Conto et chant folklorique chinois. Tous les clips sont chantés par des chanteurs professionnels et enregistrés dans des studios d'enregistrement commerciaux professionnels.

Utilisation directe :

https://hyper.ai/datasets/29086

5. Ensemble de données de classification des sentiments musicaux NetEase Cloud

L'ensemble de données contient environ 395 000 données d'étiquettes d'émotions musicales, chacune composée de trois colonnes principales : ID de chanson, ID de playlist et étiquette d'émotion de chanson. La source de ces données est le site officiel de NetEase Cloud Music, qui fournit des informations détaillées sur le marquage des émotions des chansons. En raison de la grande taille de l'ensemble de données, il convient à la création de modèles d'analyse des sentiments, à la réalisation d'exploration de données et à l'acquisition d'une compréhension approfondie de la relation entre la musique et les émotions.

Utilisation directe :

https://hyper.ai/datasets/29133

6. Ensemble de données de remix de musique miHoYo pour piano

Cet ensemble de données contient principalement miHoYo  Extraits de musique de piano de deux de ses jeux, « Genshin Impact » et « Honkai : Star Rail ». Ces passages pour piano ont été convertis en notation ABC. Les chercheurs peuvent utiliser cette ressource pour analyser en profondeur les caractéristiques musicales telles que les notes et la structure mélodique, fournissant un support de données substantiel pour la formation et l'amélioration des algorithmes de génération de musique.

Utilisation directe :

https://hyper.ai/datasets/29150

7. Ensemble de données d'analyse musicale FMA

FMA est un ensemble de données d'analyse musicale composé d'audio HQ complet, de fonctionnalités pré-calculées, ainsi que de métadonnées au niveau de la piste et de l'utilisateur, qui peuvent être utilisées pour évaluer plusieurs tâches dans MIR (Music Information Retrieva).

Utilisation directe :

https://hyper.ai/datasets/29162

8. Détection de cellules d'algues à haut débit Ensemble de données de détection de cellules d'algues

Cet ensemble de données provient du défi de détection d'objets « Vision Meets Algae » de la conférence IEEE Network Informatics 2023, comprenant des ensembles de formation et des ensembles de test. L'ensemble d'entraînement contient 700 images et l'ensemble de test contient 300 images, qui sont divisées en 6 catégories. L'ensemble d'entraînement est annoté au format YOLO et chaque image possède un fichier d'annotation .txt correspondant.

Utilisation directe :

https://hyper.ai/datasets/29158

9. Ensemble de données de raisonnement mathématique MathVista

MathVista est une référence complète de raisonnement mathématique dans un environnement visuel. Il se compose de trois ensembles de données nouvellement créés, IQTest, FunctionQA et PaperQA, qui sont utilisés pour évaluer respectivement le raisonnement logique sur les graphiques de test de puzzle, le raisonnement algébrique sur les graphiques de fonctions et le raisonnement scientifique sur les graphiques de documents académiques. MathVista contient un total de 6 141 exemples collectés à partir de 31 ensembles de données différents.

Utilisation directe :

https://hyper.ai/datasets/29122

10. Animaux 10 types d'images d'animaux

L'ensemble de données contient environ 28 000 images d'animaux de qualité moyenne appartenant à 10 catégories : chien, chat, cheval, araignée, papillon, poulet, mouton, vache, écureuil, éléphant. Peut être utilisé pour tester différents réseaux de reconnaissance d'images.

Utilisation directe :

https://hyper.ai/datasets/29079

ScienceAI  Études de cas sélectionnées

1. L'IA permet un refroidissement écologique, l'Université Lingnan de Hong Kong développe un modèle DEMMFL pour la prévision de la charge de refroidissement des bâtiments

Des chercheurs de l'Université Lingnan et de l'Université de la ville de Hong Kong ont proposé un nouveau modèle d'apprentissage dynamique des caractéristiques multimodales (DEMMFL) dans le cadre du « Global Artificial Intelligence Challenge for Building Mechanical and Electrical Facilities » qui peut prédire avec précision les charges de refroidissement des bâtiments et contribuer à économiser de l'énergie. Des articles connexes ont été publiés dansÉnergie appliquée"Journal.

Voir le rapport complet :

https://hyper.ai/news/29108

2. Roulez-vous ? Nvidia lance un grand modèle ChipNeMo, personnalisé pour la conception de puces

Nvidia a publié un modèle de langage personnalisé de grande taille, ChipNeMo, formé sur la base de ses propres données internes pour aider les ingénieurs à accomplir les tâches liées à la conception de puces. Cet article est une introduction détaillée à ChipNeMo.

Voir le rapport complet :

https://hyper.ai/news/29134

Articles populaires de l'encyclopédie

1. Norme nucléaire

2. Test t apparié

3. Informatique distribuée

4. Mélange d'experts (MoE)

5. Génération augmentée par récupération (RAG)

Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :https://hyper.ai/wiki

Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous aimeriez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !

À la semaine prochaine !

À propos d'HyperAI

HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :

* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques

* Comprend plus de 300 tutoriels en ligne classiques et populaires

* Interprétation de plus de 100 cas d'articles AI4Science

* Prise en charge de plus de 500 termes de recherche associés

* Hébergement de la première documentation complète d'Apache TVM en Chine

Visitez le site Web officiel pour commencer votre parcours d'apprentissage :https://hyper.ai/