HyperAI초신경

데이터세트 요약 | 영화/노래 추천, 영화 리뷰, 가사 인식, 음악 장르 등을 포함하는 18개의 영화/음악 데이터 세트...

特色图像

여행을 하든, 집에서 수련을 하든, 영화와 음악은 항상 다양한 형태로 우리와 함께하며, 심지어 우리 삶에 활력을 불어넣는 '조미료'가 되기도 했습니다.

매년 국경일 연휴 동안에는 영화관에서 영화 관람이 최고조에 달합니다. 작년 국경절 연휴 기간 영화시장 박스오피스 누적액은 27억 3,400만 위안으로, 2022년 동기 대비 83%배 증가했으며, 누적 관객 수는 6,511만 4,000명을 넘어섰다고 합니다.

동시에 중국공연예술산업협회의 통계에 따르면 2023년 9월 29일부터 10월 6일까지 전국에서 총 44,200건의 상업공연(오락장 공연 제외)이 열렸으며, 이 중 대규모 콘서트와 음악 축제가 121건, 흥행수입은 5.41억 위안, 관객수는 836,600명에 달했습니다.

이는 영화와 음악이 우리 삶에서 얼마나 중요한지를 보여줍니다! 여기,HyperAI는 영화/음악 추천, 영화 리뷰 예측, 가사 인식 등을 포함하여 영화 및 음악 관련 데이터 세트를 편집했습니다.필요에 따라 다운로드하여 휴가를 더욱 즐겁게 보낼 수 있습니다.

더 많은 오픈 소스 데이터 세트를 보려면 클릭하세요.

https://go.hyper.ai/E1jBL

QR 코드를 스캔하고 "데이터 세트"에 표시하여 토론 그룹에 참여하세요↓

영화 데이터 세트 요약

1. 영화 추천 데이터 세트

출판 플랫폼:캐글

예상 크기:8.89MB

다운로드 주소:https://go.hyper.ai/2uTxh

이 데이터 세트에는 영화의 줄거리, 배우, 제작진, 예산, 수익 등을 포함하여 TMDB의 5,000개 영화 데이터 세트가 포함되어 있습니다. 영화 추천 시스템, 영화 시장 분석 등 다양한 응용 분야에 적합합니다.

2. TMDB 영화 데이터 세트

출판 플랫폼:캐글

출시 시간:2024

예상 크기:199.09MB

다운로드 주소:https://go.hyper.ai/4uTYb

TMDB는 100만 개의 영화를 TMDB 데이터베이스에 등록하여 제목, 등급, 개봉일, 수익, 장르 등의 세부 정보를 제공하는 포괄적인 영화 데이터베이스입니다.

3. AclImdb – v1 대규모 영화 리뷰 데이터 세트

출판사:스탠포드 대학교

출시 시간:2011

예상 크기:80.23MB

다운로드 주소:https://go.hyper.ai/CdpFg

AclImdb – v1 데이터 세트는 이진 감정 분류를 위한 대규모 영화 리뷰 데이터 세트로, 훈련용 25,000개, 테스트용 25,000개 영화 리뷰와 추가적으로 레이블이 지정되지 않은 데이터도 사용할 수 있습니다.

4. 넷플릭스 영화 리뷰 데이터 세트

출판 플랫폼:넷플릭스 상품

예상 크기:665.24MB

다운로드 주소:https://go.hyper.ai/nWG97

넷플릭스 영화 리뷰 데이터 세트에는 17,000편의 영화에 대한 480,000명의 사용자 평가 데이터가 포함되어 있으며, 100만 개가 넘는 리뷰가 있습니다. 데이터는 1998년 10월부터 2005년 11월까지 수집되었습니다. 평가는 5점 만점 시스템을 기반으로 하며, 사용자 정보는 익명화되었습니다.

5. MovieLens 영화 추천 데이터 세트
출판사:미네소타 대학교의 GroupLens 연구팀

출시 시간:2018

다운로드 주소:https://go.hyper.ai/RFNqY

이 데이터 세트는 영화 추천 시스템의 연구 및 개발에 사용될 수 있습니다. 이 데이터 세트에는 MovieLens 100K, MovieLens 1M, MovieLens 10M, MovieLens 20M 등을 포함하되 이에 국한되지 않는 여러 버전이 있습니다. 이 데이터 세트는 머신 러닝, 데이터 마이닝 및 개인화된 추천 시스템 연구에 널리 사용됩니다.

6. IMDB 영화 리뷰 데이터 세트

출판사:스탠포드 대학교

출시 시간:2011

예상 크기:137.77MB

다운로드 주소:https://go.hyper.ai/n247h

이 데이터 세트는 감정의 이진 분류에 적합하며, 감정 분류의 벤치마크로 사용되도록 고안되었습니다. 여기에는 50,000개의 레이블이 붙은 양극화된 영화 리뷰와 50,000개의 레이블이 붙지 않은 데이터가 포함되어 있습니다.

7. 위키피디아 영화 줄거리 데이터 세트

출판사:매사추세츠 공과대학교

출시 시간:2018

예상 크기:29.55MB

다운로드 주소:https://go.hyper.ai/CnrF2

위키피디아 영화 줄거리 데이터 세트에는 전 세계 영화 34,886편이 포함되어 있습니다. 각 영화에는 개봉 연도, 제목, 영화 국적, 감독, 주연 배우, 줄거리 소개 등이 포함됩니다. 이 데이터 세트는 영화 장르 예측 및 관련 영화 추천과 같은 다중 클래스 문제 처리에 사용할 수 있습니다.

8. MovieNet 영화 이해 데이터 세트

출판사:홍콩 중국 대학교

출시 시간:2020

예상 크기:263.58GB

다운로드 주소:https://go.hyper.ai/tfoDz

MovieNet은 예고편, 사진, 줄거리 설명 등 다양한 멀티모달 데이터를 포함하는 1,100편의 영화를 이해하기 위한 데이터 세트입니다. 또한 MovieNet에서는 다양한 측면에 대한 수동 주석도 제공됩니다.

9. 영화 정보 및 등급 데이터 세트

출판 플랫폼:캐글

예상 크기:227.8MB

다운로드 주소:https://go.hyper.ai/s5DFC

이 데이터 세트에는 전체 MovieLens 데이터 세트에 포함된 45,000개 영화에 대한 자세한 메타데이터가 포함되어 있습니다. 이 데이터 세트는 영화의 기본 정보뿐만 아니라 출시일, 언어 등의 자세한 정보도 포함합니다. 또한 27만 명의 사용자로부터 받은 2,600만 건의 평점이 포함되어 있으며, 1점에서 5점까지 평가되어 영화 인기를 연구하는 데 귀중한 데이터를 제공합니다.

음악 데이터 세트 요약

1. 온라인 음악 시스템 정보 데이터 세트

출판사:마드리드 자치대학교 정보 검색 그룹

출시 시간:2011

예상 크기:2.47MB

다운로드 주소:https://go.hyper.ai/Ig3WD

이 데이터 세트에는 2,000명의 사용자와 Last.fm 음악 플랫폼 간의 상호작용 데이터가 포함되어 있으며, 여기에는 사용자의 친구 관계, 태그, 음악가 및 해당 아티스트의 태그 정보가 포함됩니다. 연구자들이 소셜 네트워크 데이터, 사용자 태그 및 기타 정보를 활용해 추천 알고리즘을 개선하는 방법을 연구하도록 돕습니다.

2. OpenMIIR 음악 청취 EEG 데이터 세트

출판사:오웬 랩, 서부 온타리오 대학교

출시 시간:2016

예상 크기:5.88GB

다운로드 주소:https://go.hyper.ai/0qG3t

OpenMIIR은 음악 인식 및 상상 중에 수집된 뇌파(EEG) 기록을 기반으로 하는 퍼블릭 도메인 데이터 세트입니다. 이 제품은 참가자가 12개의 음악 클립을 듣는 동안의 EEG 데이터와 이에 상응하는 음악 자극을 포함하고 있으며, 주로 음악 감상 중 뇌파의 변화를 분석하는 데 사용됩니다.

3. NetEase 클라우드 음악 감정 분류 데이터 세트
출판 플랫폼:허깅페이스

예상 크기:4.05MB

다운로드 주소:https://go.hyper.ai/OKA4L

NetEase Cloud Music 감정 분류 데이터 세트에는 약 395,000개의 음악 감정 레이블 데이터가 포함되어 있으며, 각 레이블은 노래 ID, 재생 목록 ID, 노래 감정 레이블의 세 가지 주요 열로 구성됩니다. 이는 감정 분석 모델 구축, 데이터 마이닝 수행, 음악과 감정 간의 관계를 심층적으로 이해하는 데 적합합니다.

4. MusicNet 음악 데이터 세트
출판사:워싱턴 대학교

출시 시간:2017

예상 크기:10.34GB

다운로드 주소:https://go.hyper.ai/ZPuMa

MusicNet은 음악 연구에서 머신 러닝 방법을 감독하고 평가하기 위한 대규모 음악 데이터 세트입니다. 이 데이터 세트는 저작권이 없는 클래식 음악 레코드 330개와 주석이 달린 레이블 100만 개 이상으로 구성되어 있으며, 음악가가 평가하고 검증했으며 레이블 오류율은 4%에 불과합니다.

5. URMP 음악 공연 시청각 분석 데이터 세트

출판사:전기 및 전자 엔지니어 협회

예상 크기:11.27GB

다운로드 주소:https://go.hyper.ai/0sjUP

URMP는 음악 공연의 시청각적 분석을 위한 데이터 세트입니다. 이 데이터 세트는 각 트랙의 개별 녹음된 연주로 구성된 44개의 간단한 다중 악기 음악 작품으로 구성되어 있습니다. 각 곡에 대해 데이터 세트는 MIDI 형식의 악보, 개별 악기의 고품질 녹음, 합성된 곡의 비디오를 제공합니다.

6. CCMUSIC 음악 장르 데이터셋
출판사:중국과학원 자동화 연구소

출시 시간:2017

예상 크기:16.93GB

다운로드 주소:https://go.hyper.ai/mBXI6

이 데이터베이스에는 NetEase Cloud Music의 약 1,700개 음악 작품(mp3 형식)이 포함되어 있습니다. 음악은 270~300초 길이이고 16개 장르로 나뉩니다.

7. Music21 뮤직비디오 데이터 세트
출판사:매사추세츠 공과대학교

출시 시간:2009

예상 크기:42.29MB

다운로드 주소:https://go.hyper.ai/U4qDT

Music21은 키워드로 YouTube에서 크롤링한 트리밍되지 않은 비디오 데이터 세트입니다. 여기에는 시각적 음원 분리 모델을 훈련하고 평가하는 데 사용할 수 있는 고품질 데이터가 포함된 21개 카테고리의 음악 공연이 포함되어 있습니다.

8. MusicPile 대규모 음악 데이터 세트
출판 플랫폼:허깅페이스

출시 시간:2023

예상 크기:6.33GB

다운로드 주소:https://go.hyper.ai/tuVEy

이 데이터 세트에는 517만 개의 샘플과 약 41억 6천만 개의 토큰이 포함되어 있습니다. 데이터 세트에는 id, text, src라는 세 개의 필드가 포함되어 있습니다. 각 텍스트에는 최대 2,048개의 토큰이 있습니다. MusicPile은 광범위한 음악 상식, 지식 관련 질문과 답변, 전형적인 음악 이론 콘텐츠를 포괄하여 대형 모델의 음악 이해 및 창작 능력을 향상시키는 데 핵심적인 역할을 합니다.

9. 역대 최고의 5,000개 앨범 데이터 세트
출판 플랫폼:캐글

출시 시간:2021

예상 크기:302KB

다운로드 주소:https://go.hyper.ai/SGAHV

이 데이터 세트에는 다음이 포함됩니다. http://rateyourmusic.com 사용자들이 선정한 상위 5,000개 앨범에는 순위, 앨범 제목, 아티스트 이름, 발매일, 장르, 설명자, 평균 평점, 평점 수, 리뷰 수가 포함됩니다.

위는 HyperAI가 수집한 영화 및 음악 데이터 세트입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기고문을 제출하여 알려주세요! QR 코드를 스캔하고 "데이터 세트"에 표시하여 토론 그룹에 참여하세요↓

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

* 1200개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공

* 300개 이상의 고전적이고 인기 있는 온라인 튜토리얼이 포함되어 있습니다.

* 100개 이상의 AI4Science 논문 사례 해석

* 500개 이상의 관련 용어 검색 지원

* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai