HyperAI

Résumé De L'ensemble De Données | 18 Ensembles De Données De Films/musiques, Couvrant Les Recommandations De Films/chansons, Les Critiques De Films, La Reconnaissance Des Paroles, Les Genres Musicaux...

特色图像

Que nous soyons en voyage ou que nous restions à la maison pour nous cultiver, le cinéma et la musique nous accompagnent toujours sous diverses formes, et sont même devenus un « condiment » pour pimenter nos vies.

Chaque année, à l'occasion de la Fête nationale, les cinémas connaissent un pic d'affluence. Il est rapporté que le box-office total du marché du film pendant les vacances de la Fête nationale de l'année dernière a accumulé 2,734 milliards de yuans, dépassant la même période en 2022 de 83%, et le nombre total de cinéphiles a dépassé 65,114 millions.

Dans le même temps, les statistiques de l'Association chinoise de l'industrie des arts du spectacle montrent qu'entre le 29 septembre et le 6 octobre 2023, il y a eu un total de 44 200 représentations commerciales (à l'exclusion des représentations dans des lieux de divertissement) à l'échelle nationale, dont 121 concerts et festivals de musique à grande échelle, avec des recettes au box-office de 541 millions de yuans et 836 600 spectateurs.

Cela montre à quel point les films et la musique sont importants dans nos vies ! Ici,HyperAI a compilé pour vous des ensembles de données liés aux films et à la musique, notamment des recommandations de films/musiques, des prédictions de critiques de films, la reconnaissance des paroles, etc.Vous pouvez le télécharger à la demande pour rendre vos vacances plus excitantes.

Cliquez pour voir plus d'ensembles de données open source :

https://go.hyper.ai/E1jBL

Scannez le code QR et notez « dataset » pour rejoindre le groupe de discussion↓

Résumé de l'ensemble de données sur les films

1. Ensemble de données de recommandation de films

Plateforme de publication :Kaggle

Taille estimée :8,89 Mo

Adresse de téléchargement :https://go.hyper.ai/2uTxh

Cet ensemble de données contient 5 000 ensembles de données de films de TMDB, y compris les intrigues, les acteurs, l'équipe, les budgets et les revenus des films. Il convient à une variété de scénarios d'application tels que les systèmes de recommandation de films et l'analyse du marché du cinéma.

2. Ensemble de données de films TMDB

Plateforme de publication :Kaggle

Heure de sortie :2024

Taille estimée :199,09 Mo

Adresse de téléchargement :https://go.hyper.ai/4uTYb

TMDB est une base de données de films complète qui contient une collection d'un million de films de la base de données TMDB, fournissant des informations sur les films, y compris des détails tels que le titre, la note, la date de sortie, les revenus, le genre, etc.

3. AclImdb – v1 Grand ensemble de données de critiques de films

Agence d'édition :Université de Stanford

Heure de sortie :2011

Taille estimée :80,23 Mo

Adresse de téléchargement :https://go.hyper.ai/CdpFg

AclImdb – v1 Dataset est un ensemble de données de critiques de films à grande échelle pour la classification des sentiments binaires, avec 25 000 critiques de films pour la formation, 25 000 pour les tests et des données supplémentaires non étiquetées disponibles.

4. Ensemble de données sur les critiques de films Netflix

Plateforme de publication :Prix Netflix

Taille estimée :665,24 Mo

Adresse de téléchargement :https://go.hyper.ai/nWG97

L'ensemble de données de critiques de films Netflix contient des données d'évaluation de 480 000 utilisateurs sur 17 000 films, avec plus d'un million de critiques. Les données ont été collectées d’octobre 1998 à novembre 2005. Les notes sont basées sur un système à 5 points et les informations des utilisateurs ont été anonymisées.

5. Ensemble de données de recommandation de films MovieLens
Agence d'édition :Équipe de recherche GroupLens de l'Université du Minnesota

Heure de sortie :2018

Adresse de téléchargement :https://go.hyper.ai/RFNqY

Cet ensemble de données peut être utilisé pour la recherche et le développement de systèmes de recommandation de films. Il existe plusieurs versions de l'ensemble de données, y compris, mais sans s'y limiter, MovieLens 100K, MovieLens 1M, MovieLens 10M, MovieLens 20M, etc. Il est largement utilisé dans la recherche sur l'apprentissage automatique, l'exploration de données et les systèmes de recommandation personnalisés.

6. Ensemble de données de critiques de films IMDB

Agence d'édition :Université de Stanford

Heure de sortie :2011

Taille estimée :137,77 Mo

Adresse de téléchargement :https://go.hyper.ai/n247h

Cet ensemble de données convient à la classification binaire des sentiments et est destiné à être utilisé comme référence pour la classification des sentiments. Il contient 50 000 critiques de films étiquetées et polarisées et 50 000 données non étiquetées.

7. Ensemble de données Wikipédia sur les intrigues de films

Agence d'édition :Institut de technologie du Massachusetts

Heure de sortie :2018

Taille estimée :29,55 Mo

Adresse de téléchargement :https://go.hyper.ai/CnrF2

L'ensemble de données Wikipedia Movie Plots contient 34 886 films du monde entier. Chaque film comprend l'année de sortie, le titre, la nationalité du film, le réalisateur, les acteurs principaux, l'introduction de l'intrigue, etc. Cet ensemble de données peut être utilisé pour le traitement de problèmes multi-classes tels que la prédiction des genres de films et la recommandation de films associés.

8. Ensemble de données de compréhension des films MovieNet

Agence d'édition :L'Université chinoise de Hong Kong

Heure de sortie :2020

Taille estimée :263,58 Go

Adresse de téléchargement :https://go.hyper.ai/tfoDz

MovieNet est un ensemble de données pour la compréhension des films qui contient 1 100 films avec une grande quantité de données multimodales telles que des bandes-annonces, des photos, des descriptions d'intrigues, etc. De plus, des annotations manuelles de différents aspects sont fournies dans MovieNet.

9. Ensemble de données sur les films et les notes

Plateforme de publication :Kaggle

Taille estimée :227,8 Mo

Adresse de téléchargement :https://go.hyper.ai/s5DFC

Cet ensemble de données contient des métadonnées détaillées pour les 45 000 films de l'ensemble de données complet MovieLens. Cet ensemble de données couvre non seulement les informations de base des films, mais comprend également des informations détaillées telles que la date de sortie, la langue, etc. De plus, il contient 26 millions de notes de 270 000 utilisateurs, qui sont notées de 1 à 5 points, fournissant des données précieuses pour étudier la popularité des films.

Résumé de l'ensemble de données musicales

1. Ensemble de données d'informations sur le système de musique en ligne

Agence d'édition :Groupe de recherche d'informations de l'Université autonome de Madrid

Heure de sortie :2011

Taille estimée :2,47 Mo

Adresse de téléchargement :https://go.hyper.ai/Ig3WD

Cet ensemble de données contient des données d'interaction entre 2 000 utilisateurs et la plateforme musicale Last.fm, y compris les relations d'amitié des utilisateurs, les tags, les artistes musicaux et les informations sur les tags de ces artistes. Aidez les chercheurs à étudier comment utiliser les données des réseaux sociaux, les balises utilisateur et d’autres informations pour améliorer les algorithmes de recommandation.

2. Ensemble de données EEG d'écoute musicale OpenMIIR

Agence d'édition :Laboratoire Owen, Université Western Ontario

Heure de sortie :2016

Taille estimée :5,88 Go

Adresse de téléchargement :https://go.hyper.ai/0qG3t

OpenMIIR est un ensemble de données du domaine public basé sur des enregistrements d'électroencéphalogramme (EEG) pris pendant la perception musicale et l'imagination. Il contient des données EEG des participants lors de l'écoute de 12 clips musicaux, ainsi que les stimuli musicaux correspondants, et est principalement utilisé pour analyser les changements dans les ondes cérébrales pendant l'écoute de musique.

3. Ensemble de données de classification des sentiments musicaux NetEase Cloud
Plateforme de publication :Visage qui fait des câlins

Taille estimée :4,05 Mo

Adresse de téléchargement :https://go.hyper.ai/OKA4L

L'ensemble de données de classification des sentiments de NetEase Cloud Music contient environ 395 000 données d'étiquettes de sentiments musicaux, chacune composée de trois colonnes principales : ID de chanson, ID de playlist et étiquette de sentiment de chanson. Il convient à la création de modèles d'analyse des sentiments, à l'exploration de données et à la compréhension approfondie de la relation entre la musique et le sentiment.

4. Ensemble de données musicales MusicNet
Agence d'édition :Université de Washington

Heure de sortie :2017

Taille estimée :10,34 Go

Adresse de téléchargement :https://go.hyper.ai/ZPuMa

MusicNet est un grand ensemble de données musicales permettant de superviser et d'évaluer les méthodes d'apprentissage automatique dans la recherche musicale. L'ensemble de données comprend 330 enregistrements de musique classique libres de droits et plus d'un million d'étiquettes annotées, et est évalué et vérifié par des musiciens, avec un taux d'erreur d'étiquette de seulement 4%.

5. Ensemble de données d'analyse audiovisuelle des performances musicales URMP

Agence d'édition :Institut des ingénieurs électriciens et électroniciens

Taille estimée :11,27 Go

Adresse de téléchargement :https://go.hyper.ai/0sjUP

URMP est un ensemble de données pour l'analyse audiovisuelle des performances musicales. L'ensemble de données comprend 44 morceaux de musique multi-instrumentaux simples constitués d'interprétations enregistrées individuellement de pistes individuelles. Pour chaque morceau, l'ensemble de données fournit une partition musicale au format MIDI, des enregistrements de haute qualité d'instruments individuels et une vidéo du morceau synthétisé.

6. Ensemble de données sur les genres musicaux CCMUSIC
Agence d'édition :Institut d'automatisation, Académie chinoise des sciences

Heure de sortie :2017

Taille estimée :16,93 Go

Adresse de téléchargement :https://go.hyper.ai/mBXI6

La base de données contient environ 1 700 morceaux de musique (au format mp3) de NetEase Cloud Music. La musique dure entre 270 et 300 secondes et est divisée en 16 genres.

7. Ensemble de données de clips musicaux Music21
Agence d'édition :Institut de technologie du Massachusetts

Heure de sortie :2009

Taille estimée :42,29 Mo

Adresse de téléchargement :https://go.hyper.ai/U4qDT

Music21 est un ensemble de données vidéo non découpées extraites de YouTube par mots-clés. Il contient des performances musicales de 21 catégories avec des données de haute qualité qui peuvent être utilisées pour former et évaluer des modèles de séparation de sources sonores visuelles.

8. Grand ensemble de données musicales MusicPile
Plateforme de publication :Visage qui fait des câlins

Heure de sortie :2023

Taille estimée :6,33 Go

Adresse de téléchargement :https://go.hyper.ai/tuVEy

L'ensemble de données contient 5,17 millions d'échantillons et environ 4,16 milliards de jetons. L'ensemble de données contient trois champs : id, text et src. Chaque morceau de texte ne contient pas plus de 2 048 jetons. MusicPile couvre un large éventail de questions et réponses de bon sens musical et de contenu de théorie musicale typique, qui joue un rôle clé dans l'amélioration de la compréhension musicale et de la capacité de création du grand modèle.

9. Le meilleur ensemble de données de 5 000 albums jamais créé
Plateforme de publication :Kaggle

Heure de sortie :2021

Taille estimée :302 Ko

Adresse de téléchargement :https://go.hyper.ai/SGAHV

Cet ensemble de données contient les http://rateyourmusic.com Les 5 000 meilleurs albums déterminés par les utilisateurs, y compris le classement, le titre de l'album, le nom de l'artiste, la date de sortie, le genre, les descripteurs, la note moyenne, le nombre de notes et le nombre de critiques.

Ce qui précède est l'ensemble de données de films et de musique compilé par HyperAI. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, n'hésitez pas à laisser un message ou à soumettre une contribution pour nous le faire savoir ! Scannez le code QR et notez « dataset » pour rejoindre le groupe de discussion↓

À propos d'HyperAI

HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :

* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques

* Comprend plus de 300 tutoriels en ligne classiques et populaires

* Interprétation de plus de 100 cas d'articles AI4Science

* Prise en charge de plus de 500 termes de recherche associés

* Hébergement de la première documentation complète d'Apache TVM en Chine

Visitez le site Web officiel pour commencer votre parcours d'apprentissage :

https://hyper.ai