遊びに出かけるときも、家で療養するときも、映画や音楽はさまざまな形で私たちに寄り添い、私たちの生活を彩る「ソース」にもなっています。
毎年、国慶節の連休中、映画館は映画鑑賞のピークを迎えます。報道によると、昨年の国慶節映画市場の総興行収入は27億3,400万ドルで、2022年の同時期の83%を上回り、映画観客総数は6,511万4,000人を超えた。
同時に、中国公演産業協会の統計によると、2023年9月29日から10月6日までに、大規模なコンサートや音楽祭の公演を含む、全国で合計4万4,200件の商業公演(娯楽施設での公演を除く)が行われた。公演数は121回、興行収入は5億4,100万元、観客動員数は83万6,600人だった。
映画と音楽がすべての人の生活に大きな役割を果たしていることがわかります。ここ、HyperAI Super Neural は、映画/音楽の推奨、映画の評価予測、歌詞認識などの側面を含む、映画と音楽に関連するデータセットを誰でも利用できるようにまとめています。オンデマンドでダウンロードして、休暇をよりエキサイティングなものにすることができます。
クリックすると、さらにオープン ソース データセットが表示されます。
QRコードを読み取って「データセット」をメモし、ディスカッショングループに参加してください↓
ムービーデータセットの概要
出版プラットフォーム:カグル
推定サイズ:8.89MB
ダウンロードアドレス:https://go.hyper.ai/2uTxh
このデータ セットには、映画のプロット、俳優、スタッフ、予算、収入を含む TMDB の 5,000 の映画データ セットが含まれており、映画推薦システムや映画市場分析などのさまざまなアプリケーション シナリオに適しています。
出版プラットフォーム:カグル
発売時期:2024年
推定サイズ:199.09MB
ダウンロードアドレス:https://go.hyper.ai/4uTYb
TMDB は、TMDB データベースからの 100 万本の映画のコレクションを含む包括的な映画データベースであり、タイトル、評価、公開日、収益、ジャンルなどの詳細を含む映画に関する情報を提供します。
3. AclImdb – v1 大規模な映画レビュー データ セット
発行機関:スタンフォード大学
発売時期:2011年
推定サイズ:80.23MB
ダウンロードアドレス:https://go.hyper.ai/CdpFg
AclImdb – v1 データセットは、バイナリ感情分類用の大規模な映画レビュー データセットで、トレーニング用に 25,000 件の映画レビュー、テスト用に 25,000 件の映画レビュー、およびその他のラベルなしデータが利用可能です。
出版プラットフォーム:Netflix賞
推定サイズ:665.24MB
ダウンロードアドレス:https://go.hyper.ai/nWG97
Netflix 映画レビュー データ セットには、17,000 件の映画に関する 480,000 人のユーザーからのレビュー データが含まれており、データ収集期間は 1998 年 10 月から 2005 年 11 月までであり、評価は 5 段階評価に基づいています。情報が鈍感になった。
5. MovieLens の映画推奨データセット
発行機関:ミネソタ大学 GroupLens 研究チーム
発売時期:2018年
ダウンロードアドレス:https://go.hyper.ai/RFNqY
このデータ セットは、映画推奨システムの研究開発に使用でき、MovieLens 100K、MovieLens 1M、MovieLens 10M、MovieLens 20M などを含むがこれらに限定されない複数のバージョンがあり、機械学習で広く使用されています。 、研究におけるデータマイニングとパーソナライズされた推奨システム。
発行機関:スタンフォード大学
発売時期:2011年
推定サイズ:137.77MB
ダウンロードアドレス:https://go.hyper.ai/n247h
このデータセットは感情の二値分類に適しており、感情分類のベンチマークとして機能することを目的としています。ラベル付きの偏った映画レビューが 50,000 件含まれており、ラベルなしのデータも 50,000 件あります。
発行機関:マサチューセッツ工科大学
発売時期:2018年
推定サイズ:29.55MB
ダウンロードアドレス:https://go.hyper.ai/CnrF2
Wikipedia 映画プロット データセットには、世界中の 34,886 本の映画が含まれています。各映画には、公開年、タイトル、映画の国籍、監督、主演、あらすじの紹介などが含まれています。このデータ セットは、映画ジャンルの予測や関連映画の推奨など、複数の種類の問題に対処するために使用できます。
発行機関:香港中文大学
発売時期:2020年
推定サイズ:263.58GB
ダウンロードアドレス:https://go.hyper.ai/tfoDz
MovieNet は、予告編、写真、プロットの説明などの大量のマルチモーダル データを含む 1,100 本の映画を含む、映画理解のためのデータセットです。さらに、手動注釈のさまざまな側面が MovieNet で利用可能です。
出版プラットフォーム:カグル
推定サイズ:227.8MB
ダウンロードアドレス:https://go.hyper.ai/s5DFC
このデータセットには、完全な MovieLens データセット内の 45,000 本の映画の詳細なメタデータが含まれています。このデータセットには、映画に関する基本情報だけでなく、公開日、言語などの詳細情報も含まれています。さらに、27 万人のユーザーによる 1 から 5 までの 2,600 万件の評価が含まれており、映画の人気を調査するための貴重なデータを提供します。
音楽データセットの概要
発行機関:マドリッド自治大学の情報検索グループ
発売時期:2011年
推定サイズ:2.47MB
ダウンロードアドレス:https://go.hyper.ai/Ig3WD
このデータ セットには、ユーザーの友人関係、タグ、音楽アーティスト、およびこれらのアーティストのタグ情報を含む、Last.fm 音楽プラットフォームとの 2,000 人のユーザーのインタラクション データが含まれています。研究者がソーシャル ネットワーク データ、ユーザー タグ、その他の情報を使用して推奨アルゴリズムを改善する方法を研究するのを支援します。
発行機関:西オンタリオ大学オーウェン研究室
発売時期:2016年
推定サイズ:5.88GB
ダウンロードアドレス:https://go.hyper.ai/0qG3t
OpenMIIR は、音楽の知覚と想像中に撮影された脳波 (EEG) の記録に基づいたパブリック ドメインのデータセットです。これには、12 の音楽クリップを聴いているときの参加者の脳波データと対応する音楽刺激が含まれており、主に音楽鑑賞中の脳波の変化を分析するために使用されます。
3. NetEase Cloud音楽感情分類データセット
出版プラットフォーム:抱きしめる顔
推定サイズ:4.05MB
ダウンロードアドレス:https://go.hyper.ai/OKA4L
NetEase Cloud の音楽感情分類データ セットには、約 395,000 個の音楽感情ラベル データが含まれています。各データは、曲 ID、プレイリスト ID、曲の感情ラベルの 3 つの主要な列で構成されており、感情分析モデルの構築、データ マイニングの実行に適しています。 、音楽と感情の関係をより深く理解します。
4. MusicNet音楽データセット
発行機関:ワシントン大学
発売時期:2017年
推定サイズ:10.34GB
ダウンロードアドレス:https://go.hyper.ai/ZPuMa
MusicNet は、音楽研究のための機械学習手法を監視および評価するために使用される大規模な音楽データセットです。このデータ セットは、330 件の著作権フリーのクラシック音楽レコードと 100 万を超える注釈タグで構成されており、ミュージシャンによって評価および検証されましたが、ラベル エラー率はわずか 4% でした。
発行機関:IEEE
推定サイズ:11.27GB
ダウンロードアドレス:https://go.hyper.ai/0sjUP
URMP は、音楽パフォーマンスの視聴覚分析のためのデータセットです。データセットは、個々のトラックの個別に録音された演奏で構成される 44 個のシンプルな複数楽器の楽曲で構成されています。各曲のデータセットは、MIDI 形式のスコア、個々の楽器の高品質録音、および合成された曲のビデオを提供します。
6. CCMUSIC音楽ジャンルデータセット
発行機関:中国科学院オートメーション研究所
発売時期:2017年
推定サイズ:16.93GB
ダウンロードアドレス:https://go.hyper.ai/mBXI6
このデータベースには、NetEase Cloud Music から発信される約 1,700 の音楽作品 (mp3 形式) が含まれています。音楽の長さは 270 ~ 300 秒で、16 のジャンルに分かれています。
7. Music21ミュージックビデオデータセット
発行機関:マサチューセッツ工科大学
発売時期:2009年
推定サイズ:42.29MB
ダウンロードアドレス:https://go.hyper.ai/U4qDT
Music21 は、キーワードによって YouTube からクロールされたトリミングされていないビデオ データセットです。 21 カテゴリの音楽パフォーマンスが高いデータ品質で含まれており、視覚的な音源分離モデルのトレーニングと評価に使用できます。
8. MusicPile の大規模音楽データセット
出版プラットフォーム:抱きしめる顔
発売時期:2023年
推定サイズ:6.33GB
ダウンロードアドレス:https://go.hyper.ai/tuVEy
データ セットには 517 万のサンプルと約 41 億 6000 万のトークンが含まれています。データ セットには id、text、src の 3 つのフィールドが含まれており、各テキストのトークンは 2,048 個以下です。 MusicPile は、幅広い音楽知識、知識の質問と回答、典型的な音楽理論の内容をカバーしており、大規模モデルの音楽理解と作成能力を向上させる上で重要な役割を果たします。
9.史上最高の5,000アルバムデータセット
出版プラットフォーム:カグル
発売時期:2021年
推定サイズ:302KB
ダウンロードアドレス:https://go.hyper.ai/SGAHV
このデータセットには以下が含まれます http://rateyourmusic.com ユーザーが決定した 5,000 枚のベスト アルバムには、ランキング、アルバム タイトル、アーティスト名、リリース日、ジャンル、記述子、平均評価、評価数、レビュー数が含まれます。
上記は、HyperAI があなたのために編集した映画と音楽のデータ セットです。hyper.ai の公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、私たちに知らせてください。 QRコードを読み取って「データセット」をメモし、ディスカッショングループに参加してください↓
HyperAIについて Hyper.ai
HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。
* 1,200 を超える公開データセットに対して国内の高速ダウンロード ノードを提供
* 300 以上の古典的で人気のあるオンライン チュートリアルが含まれています
* 100 以上の AI4Science 論文ケースを解釈
* 500 以上の関連用語クエリをサポート
*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします
学習の旅を始めるには、公式 Web サイトにアクセスしてください。