HyperAI超神経

The Movies Dataset 映画情報データセット

日付

7ヶ月前

サイズ

227.8 MB

組織

カグル

ライセンス

CC BY 4.0

このデータセットには、完全な MovieLens データセット内の 45,000 本の映画の詳細なメタデータが含まれており、すべて 2017 年 7 月より前にリリースされました。このデータセットには、ポスター、背景、予算、収益などの映画に関する基本情報だけでなく、公開日、言語、制作国、会社などの詳細情報も含まれています。さらに、27 万人のユーザーによる 1 から 5 までの 2,600 万件の評価が含まれており、映画の人気を調査するための貴重なデータを提供します。

このデータセットは、映画データの探索的データ分析を通じてさまざまな種類のレコメンデーション システムを構築することを目的とした、Springboard Data Science Career Track における著者のキャップストーン プロジェクトからインスピレーションを得たものです。 Story of Movies や Movie Recommendation Systems を含む著者のノートブックには、カーネルとしてデータセットが提供されており、映画データについて詳しく知りたい研究者や開発者に実用的なツールを提供します。

データ内容:

  • 映画_メタデータ.csv:メインムービーメタデータファイル。完全な MovieLens データセットには 45,000 本の映画の情報が含まれています。情報には、ポスター、背景、予算、収益、公開日、言語、制作国、会社が含まれます。
  • キーワード.csv:MovieLens 映画の映画プロット キーワードが含まれています。文字列化された JSON オブジェクトとして提供されます。
  • クレジット.csv:すべての映画のキャストとスタッフの情報が含まれています。文字列化された JSON オブジェクトとして提供されます。
  • リンク.csv:Full MovieLens データセット内のすべてのムービーの TMDB ID と IMDB ID を含むファイル。
  • リンク_small.csv:完全なデータセットからの 9,000 本の映画の小さなサブセットの TMDB ID と IMDB ID が含まれています。
  • 評価_small.csv: 700 人のユーザーによる 9,000 本の映画に対する 100,000 件の評価のサブセット。

このデータセットを使用すると、研究者は、映画の収益や成功の可能性を予測したり、コンテンツベースの推奨エンジンや協調フィルタリング推奨システムを構築したりするなど、さまざまな分析を実行できます。これらの分析は、映画業界の動向を理解するのに役立つだけでなく、映画推奨システムの設計に科学的根拠も提供します。

the-movies-dataset-45000.torrent
シーディング 1ダウンロード中 1ダウンロード完了 148総ダウンロード数 375
  • the-movies-dataset-45000/
    • README.md
      2.6 KB
    • README.txt
      5.21 KB
      • data/
        • 45000.zip
          227.8 MB