The Movies Dataset 电影信息数据集

日期

6 个月前

大小

227.8 MB

机构

Kaggle

发布地址

www.kaggle.com

许可协议

CC BY 4.0

该数据集包含了完整 MovieLens 数据集中 45,000 部电影的详尽元数据,这些电影都是在 2017 年 7 月之前上映的。这个数据集不仅涵盖了电影的基本资料,如海报、背景、预算和收入,还包括了上映日期、语言、制作国家和公司等详细信息。此外,它还包含了 26 百万条来自 270,000 名用户的评分,这些评分为 1 至 5 分,为研究电影受欢迎程度提供了宝贵的数据。

这个数据集的灵感来源于作者在 Springboard 数据科学职业轨道的顶点项目,旨在通过电影数据的探索性数据分析,构建不同类型的推荐系统。作者的笔记本,包括《电影的故事》和《电影推荐系统》,作为内核与数据集一起提供,为有兴趣深入了解电影数据的研究人员和开发者提供了实用的工具。

数据内容:

  • movies_metadata.csv:主要电影元数据文件。包含完整 MovieLens 数据集中的 45,000 部电影的信息。信息包括海报、背景、预算、收入、上映日期、语言、制作国家和公司。
  • keywords.csv:包含 MovieLens 电影的电影情节关键词。以字符串化的 JSON 对象形式提供。
  • credits.csv:包含所有电影的演员和剧组信息。以字符串化的 JSON 对象形式提供。
  • links.csv:包含 Full MovieLens 数据集中所有电影的 TMDB 和 IMDB ID 的文件。
  • links_small.csv:包含完整数据集的 9,000 部电影小子集的 TMDB 和 IMDB ID 。
  • ratings_small.csv: 700 位用户对 9,000 部电影的 100,000 个评分的子集。

通过这个数据集,研究人员可以进行多种分析,例如预测电影收入和成功的可能性,或者构建基于内容的推荐引擎和协同过滤推荐系统。这些分析不仅有助于理解电影行业的动态,还可以为电影推荐系统的设计提供科学依据。

the-movies-dataset-45000.torrent

做种 1

下载中 0

已完成 103

总下载 292

  • the-movies-dataset-45000/
    • README.md
      2.6 KB
    • README.txt
      5.21 KB
      • data/
        • 45000.zip
          227.8 MB