영화 데이터 세트 영화 정보 데이터 세트
이 데이터 세트에는 전체 MovieLens 데이터 세트에 포함된 45,000개 영화에 대한 자세한 메타데이터가 포함되어 있으며, 이 모든 영화는 2017년 7월 이전에 개봉되었습니다. 이 데이터 세트는 포스터, 배경, 예산, 수익과 같은 영화에 대한 기본 정보뿐만 아니라 개봉일, 언어, 제작 국가, 회사와 같은 자세한 정보도 포함합니다. 또한 27만 명의 사용자로부터 받은 2,600만 건의 평점이 포함되어 있으며, 1점에서 5점까지 평가되어 영화 인기를 연구하는 데 귀중한 데이터를 제공합니다.
이 데이터 세트는 영화 데이터의 탐색적 데이터 분석을 통해 다양한 유형의 추천 시스템을 구축하는 것을 목표로 하는 Springboard Data Science Career Track의 저자의 캡스톤 프로젝트에서 영감을 얻었습니다. "영화 이야기"와 "영화 추천 시스템"을 포함한 저자의 노트북은 데이터 세트와 함께 커널로 제공되며, 영화 데이터에 대한 통찰력을 얻고자 하는 연구자와 개발자에게 실용적인 도구를 제공합니다.
데이터 내용:
- 영화_메타데이터.csv:주요 영화 메타데이터 파일. 전체 MovieLens 데이터 세트에 있는 45,000개의 영화에 대한 정보를 포함합니다. 정보에는 포스터, 배경, 예산, 수익, 출시일, 언어, 제작 국가 및 회사가 포함됩니다.
- 키워드.csv:MovieLens 영화의 영화 줄거리 키워드를 포함합니다. 문자열화된 JSON 객체로 제공됩니다.
- credits.csv:모든 영화의 출연진과 제작진 정보가 들어 있습니다. 문자열화된 JSON 객체로 제공됩니다.
- 링크.csv:Full MovieLens 데이터 세트에 있는 모든 영화의 TMDB 및 IMDB ID를 포함하는 파일입니다.
- links_small.csv:전체 데이터 세트에서 9,000개 영화의 작은 하위 집합에 대한 TMDB 및 IMDB ID가 포함되어 있습니다.
- ratings_small.csv: 9,000편의 영화에 대한 700명의 사용자로부터 얻은 100,000개의 평가의 하위 집합입니다.
연구자들은 이 데이터 세트를 사용하여 영화 수익과 성공 가능성을 예측하거나 콘텐츠 기반 추천 엔진과 협업 필터링 추천 시스템을 구축하는 등 다양한 분석을 수행할 수 있습니다. 이러한 분석은 영화 산업의 역학을 이해하는 데 도움이 될 뿐만 아니라, 영화 추천 시스템 설계를 위한 과학적 근거를 제공합니다.
the-movies-dataset-45000.torrent
시딩 1다운로드 중 1완료됨 148총 다운로드 횟수 375