データセットの概要|18 個の映画/音楽データセットの概要。映画/曲の推奨、映画の評価、歌詞の認識、音楽ジャンルをカバーします...

特色图像

遊びに出かけるときも、家で療養するときも、映画や音楽はさまざまな形で私たちに寄り添い、私たちの生活を彩る「ソース」にもなっています。

毎年、国慶節の連休中、映画館は映画鑑賞のピークを迎えます。報道によると、昨年の国慶節映画市場の総興行収入は27億3,400万ドルで、2022年の同時期の83%を上回り、映画観客総数は6,511万4,000人を超えた。

同時に、中国公演産業協会の統計によると、2023年9月29日から10月6日までに、大規模なコンサートや音楽祭の公演を含む、全国で合計4万4,200件の商業公演(娯楽施設での公演を除く)が行われた。公演数は121回、興行収入は5億4,100万元、観客動員数は83万6,600人だった。

映画と音楽がすべての人の生活に大きな役割を果たしていることがわかります。ここ、HyperAI Super Neural は、映画/音楽の推奨、映画の評価予測、歌詞認識などの側面を含む、映画と音楽に関連するデータセットを誰でも利用できるようにまとめています。オンデマンドでダウンロードして、休暇をよりエキサイティングなものにすることができます。

クリックすると、さらにオープン ソース データセットが表示されます。

https://go.hyper.ai/E1jBL

QRコードを読み取って「データセット」をメモし、ディスカッショングループに参加してください↓

ムービーデータセットの概要

1. 映画レコメンドデータセット

出版プラットフォーム:カグル

推定サイズ:8.89MB

ダウンロードアドレス:https://go.hyper.ai/2uTxh

このデータ セットには、映画のプロット、俳優、スタッフ、予算、収入を含む TMDB の 5,000 の映画データ セットが含まれており、映画推薦システムや映画市場分析などのさまざまなアプリケーション シナリオに適しています。

2. TMDB動画情報データセット

出版プラットフォーム:カグル

発売時期:2024年

推定サイズ:199.09MB

ダウンロードアドレス:https://go.hyper.ai/4uTYb

TMDB は、TMDB データベースからの 100 万本の映画のコレクションを含む包括的な映画データベースであり、タイトル、評価、公開日、収益、ジャンルなどの詳細を含む映画に関する情報を提供します。

3. AclImdb – v1 大規模な映画レビュー データ セット

発行機関:スタンフォード大学

発売時期:2011年

推定サイズ:80.23MB

ダウンロードアドレス:https://go.hyper.ai/CdpFg

AclImdb – v1 データセットは、バイナリ感情分類用の大規模な映画レビュー データセットで、トレーニング用に 25,000 件の映画レビュー、テスト用に 25,000 件の映画レビュー、およびその他のラベルなしデータが利用可能です。

4. Netflix映画評価データセット

出版プラットフォーム:Netflix賞

推定サイズ:665.24MB

ダウンロードアドレス:https://go.hyper.ai/nWG97

Netflix 映画レビュー データ セットには、17,000 件の映画に関する 480,000 人のユーザーからのレビュー データが含まれており、データ収集期間は 1998 年 10 月から 2005 年 11 月までであり、評価は 5 段階評価に基づいています。情報が鈍感になった。

5. MovieLens の映画推奨データセット
発行機関:ミネソタ大学 GroupLens 研究チーム

発売時期:2018年

ダウンロードアドレス:https://go.hyper.ai/RFNqY

このデータ セットは、映画推奨システムの研究開発に使用でき、MovieLens 100K、MovieLens 1M、MovieLens 10M、MovieLens 20M などを含むがこれらに限定されない複数のバージョンがあり、機械学習で広く使用されています。 、研究におけるデータマイニングとパーソナライズされた推奨システム。

6. IMDB映画レビューデータセット

発行機関:スタンフォード大学

発売時期:2011年

推定サイズ:137.77MB

ダウンロードアドレス:https://go.hyper.ai/n247h

このデータセットは感情の二値分類に適しており、感情分類のベンチマークとして機能することを目的としています。ラベル付きの偏った映画レビューが 50,000 件含まれており、ラベルなしのデータも 50,000 件あります。

7. ウィキペディア映画プロット データセット

発行機関:マサチューセッツ工科大学

発売時期:2018年

推定サイズ:29.55MB

ダウンロードアドレス:https://go.hyper.ai/CnrF2

Wikipedia 映画プロット データセットには、世界中の 34,886 本の映画が含まれています。各映画には、公開年、タイトル、映画の国籍、監督、主演、あらすじの紹介などが含まれています。このデータ セットは、映画ジャンルの予測や関連映画の推奨など、複数の種類の問題に対処するために使用できます。

8. MovieNet動画理解データセット

発行機関:香港中文大学

発売時期:2020年

推定サイズ:263.58GB

ダウンロードアドレス:https://go.hyper.ai/tfoDz

MovieNet は、予告編、写真、プロットの説明などの大量のマルチモーダル データを含む 1,100 本の映画を含む、映画理解のためのデータセットです。さらに、手動注釈のさまざまな側面が MovieNet で利用可能です。

9. 映画情報および評価データセット

出版プラットフォーム:カグル

推定サイズ:227.8MB

ダウンロードアドレス:https://go.hyper.ai/s5DFC

このデータセットには、完全な MovieLens データセット内の 45,000 本の映画の詳細なメタデータが含まれています。このデータセットには、映画に関する基本情報だけでなく、公開日、言語などの詳細情報も含まれています。さらに、27 万人のユーザーによる 1 から 5 までの 2,600 万件の評価が含まれており、映画の人気を調査するための貴重なデータを提供します。

音楽データセットの概要

1. オンライン音楽システム情報データセット

発行機関:マドリッド自治大学の情報検索グループ

発売時期:2011年

推定サイズ:2.47MB

ダウンロードアドレス:https://go.hyper.ai/Ig3WD

このデータ セットには、ユーザーの友人関係、タグ、音楽アーティスト、およびこれらのアーティストのタグ情報を含む、Last.fm 音楽プラットフォームとの 2,000 人のユーザーのインタラクション データが含まれています。研究者がソーシャル ネットワーク データ、ユーザー タグ、その他の情報を使用して推奨アルゴリズムを改善する方法を研究するのを支援します。

2. OpenMIIR音楽視聴EEGデータセット

発行機関:西オンタリオ大学オーウェン研究室

発売時期:2016年

推定サイズ:5.88GB

ダウンロードアドレス:https://go.hyper.ai/0qG3t

OpenMIIR は、音楽の知覚と想像中に撮影された脳波 (EEG) の記録に基づいたパブリック ドメインのデータセットです。これには、12 の音楽クリップを聴いているときの参加者の脳波データと対応する音楽刺激が含まれており、主に音楽鑑賞中の脳波の変化を分析するために使用されます。

3. NetEase Cloud音楽感情分類データセット
出版プラットフォーム:抱きしめる顔

推定サイズ:4.05MB

ダウンロードアドレス:https://go.hyper.ai/OKA4L

NetEase Cloud の音楽感情分類データ セットには、約 395,000 個の音楽感情ラベル データが含まれています。各データは、曲 ID、プレイリスト ID、曲の感情ラベルの 3 つの主要な列で構成されており、感情分析モデルの構築、データ マイニングの実行に適しています。 、音楽と感情の関係をより深く理解します。

4. MusicNet音楽データセット
発行機関:ワシントン大学

発売時期:2017年

推定サイズ:10.34GB

ダウンロードアドレス:https://go.hyper.ai/ZPuMa

MusicNet は、音楽研究のための機械学習手法を監視および評価するために使用される大規模な音楽データセットです。このデータ セットは、330 件の著作権フリーのクラシック音楽レコードと 100 万を超える注釈タグで構成されており、ミュージシャンによって評価および検証されましたが、ラベル エラー率はわずか 4% でした。

5. URMP音楽演奏視聴覚分析データセット

発行機関:IEEE

推定サイズ:11.27GB

ダウンロードアドレス:https://go.hyper.ai/0sjUP

URMP は、音楽パフォーマンスの視聴覚分析のためのデータセットです。データセットは、個々のトラックの個別に録音された演奏で構成される 44 個のシンプルな複数楽器の楽曲で構成されています。各曲のデータセットは、MIDI 形式のスコア、個々の楽器の高品質録音、および合成された曲のビデオを提供します。

6. CCMUSIC音楽ジャンルデータセット
発行機関:中国科学院オートメーション研究所

発売時期:2017年

推定サイズ:16.93GB

ダウンロードアドレス:https://go.hyper.ai/mBXI6

このデータベースには、NetEase Cloud Music から発信される約 1,700 の音楽作品 (mp3 形式) が含まれています。音楽の長さは 270 ~ 300 秒で、16 のジャンルに分かれています。

7. Music21ミュージックビデオデータセット
発行機関:マサチューセッツ工科大学

発売時期:2009年

推定サイズ:42.29MB

ダウンロードアドレス:https://go.hyper.ai/U4qDT

Music21 は、キーワードによって YouTube からクロールされたトリミングされていないビデオ データセットです。 21 カテゴリの音楽パフォーマンスが高いデータ品質で含まれており、視覚的な音源分離モデルのトレーニングと評価に使用できます。

8. MusicPile の大規模音楽データセット
出版プラットフォーム:抱きしめる顔

発売時期:2023年

推定サイズ:6.33GB

ダウンロードアドレス:https://go.hyper.ai/tuVEy

データ セットには 517 万のサンプルと約 41 億 6000 万のトークンが含まれています。データ セットには id、text、src の 3 つのフィールドが含まれており、各テキストのトークンは 2,048 個以下です。 MusicPile は、幅広い音楽知識、知識の質問と回答、典型的な音楽理論の内容をカバーしており、大規模モデルの音楽理解と作成能力を向上させる上で重要な役割を果たします。

9.史上最高の5,000アルバムデータセット
出版プラットフォーム:カグル

発売時期:2021年

推定サイズ:302KB

ダウンロードアドレス:https://go.hyper.ai/SGAHV

このデータセットには以下が含まれます http://rateyourmusic.com ユーザーが決定した 5,000 枚のベスト アルバムには、ランキング、アルバム タイトル、アーティスト名、リリース日、ジャンル、記述子、平均評価、評価数、レビュー数が含まれます。

上記は、HyperAI があなたのために編集した映画と音楽のデータ セットです。hyper.ai の公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、私たちに知らせてください。 QRコードを読み取って「データセット」をメモし、ディスカッショングループに参加してください↓

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1,200 を超える公開データセットに対して国内の高速ダウンロード ノードを提供

* 300 以上の古典的で人気のあるオンライン チュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai