Ensemble De Données Sur Les Films Ensemble De Données D'informations Sur Les Films
Date
Taille
URL de publication
Licence
CC BY 4.0
Cet ensemble de données contient des métadonnées détaillées pour 45 000 films de l'ensemble de données complet MovieLens, tous sortis avant juillet 2017. Cet ensemble de données couvre non seulement les informations de base sur les films, telles que les affiches, les arrière-plans, les budgets et les revenus, mais comprend également des informations détaillées telles que la date de sortie, la langue, le pays de production et la société. De plus, il contient 26 millions d'évaluations de 270 000 utilisateurs, notées de 1 à 5 points, fournissant des données précieuses pour étudier la popularité des films.
Cet ensemble de données a été inspiré par le projet de fin d'études de l'auteur dans le cadre du Springboard Data Science Career Track, qui vise à créer différents types de systèmes de recommandation grâce à l'analyse exploratoire des données cinématographiques. Les carnets des auteurs, notamment « The Story of Movies » et « Movie Recommender Systems », sont fournis sous forme de noyaux avec l'ensemble de données, offrant des outils pratiques aux chercheurs et aux développeurs souhaitant mieux comprendre les données cinématographiques.
Contenu des données :
- movies_metadata.csv :Fichier de métadonnées du film principal. Contient des informations sur les 45 000 films de l'ensemble de données complet MovieLens. Les informations comprennent l'affiche, le contexte, le budget, les revenus, la date de sortie, la langue, le pays de production et la société.
- mots-clés.csv :Contient des mots-clés d'intrigue de film pour les films MovieLens. Fourni sous forme d'objet JSON stringifié.
- crédits.csv :Contient des informations sur le casting et l'équipe de tous les films. Fourni sous forme d'objet JSON stringifié.
- liens.csv:Fichier contenant les identifiants TMDB et IMDB de tous les films de l'ensemble de données Full MovieLens.
- liens_petits.csv:Contient les identifiants TMDB et IMDB pour un petit sous-ensemble de 9 000 films de l'ensemble de données complet.
- notes_small.csv: Un sous-ensemble de 100 000 notes de 700 utilisateurs sur 9 000 films.
Grâce à cet ensemble de données, les chercheurs peuvent effectuer diverses analyses, telles que la prédiction des revenus des films et de leur probabilité de succès, ou la création de moteurs de recommandation basés sur le contenu et de systèmes de recommandation de filtrage collaboratif. Ces analyses aident non seulement à comprendre la dynamique de l’industrie cinématographique, mais fournissent également une base scientifique pour la conception de systèmes de recommandation de films.