Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

特色图像

AIによる音楽トレーニングの効率化を図るため、CCMusic は、計算音楽学の研究者が自由に使用できるように、いくつかの音楽およびオーディオ データ セットをオープンソース化しました。現在は hyper.ai 上で稼働しています。さらに、hyper.ai は MiHoYo や NetEase Cloud などの関連音楽データセットも更新しました。見てみましょう。

1 月 22 日から 1 月 26 日までの hyper.ai 公式 Web サイトの更新の概要:

※高品質な公開データセット:10件

※AI4S紙ケース:2枚

* 人気のある百科事典のエントリ: 10

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1CCMUSIC 本当の声と裏声のデータ セット

このデータ セットには、チェスト ボイスとファルセットの 1,280 個のモノラル歌唱オーディオ (.wav 形式) が含まれており、チェスト ボイスはチェスト ボイス、ファルセットはファルセットとラベル付けされています。

直接使用します:

https://hyper.ai/datasets/29125

2. CCMUSICピアノ音質データセット

このデータセットには、中国音楽院のピアノ室にある 7 種類のピアノ (河合アップライト ピアノ、河合グランド ピアノ、永昌アップライト ピアノ、星海アップライト ピアノ、スタインウェイ グランド シアター グランド ピアノ、スタインウェイ グランド ピアノ、珠江アップライト ピアノ) が含まれています。 ) 12 の色域オーディオ ファイル (.wav / .mp3 / .m4a 形式) と 1320 のスプリット モノラル オーディオ ファイル (.wav / .mp3 / .m4a 形式)、合計 1332 ファイル。さらに、ピアノ音質の主観評価アンケート (.xls 形式) があり、ピアノ音質の主観評価に参加した 29 人の評価が含まれています。

直接使用します:

https://hyper.ai/datasets/29097

3. CCMUSIC 音楽ジャンル データ セット

データセットには、長さ270~300秒、合計17ジャンルに分かれた約1700曲(.mp3形式)が収録されています。オリジナルの音楽には著作権の問題があるため、データセットではスペクトログラムのみが提供されています。

直接使用します:

https://hyper.ai/datasets/29094

4. CCMUSIC ベルカント民族歌唱データセット

このデータセットには、プロの歌手がベル コントと中国民謡の 2 つのスタイルで歌った数百ものアカペラの抜粋が含まれています。すべてのクリップはプロの歌手によって歌われ、プロの商業レコーディング スタジオで録音されています。

直接使用します:

https://hyper.ai/datasets/29086

5. NetEase Cloudの音楽感情分類データセット

このデータ セットには、約 395,000 個の音楽感情ラベル データが含まれており、各データは、曲 ID、プレイリスト ID、および曲感情ラベルの 3 つの主要な列で構成されます。これらのデータのソースは NetEase Cloud Music の公式 Web サイトであり、曲の感情のラベル付けに関する詳細情報が提供されています。データセットのサイズが大きいため、感情分析モデルの構築、データマイニングの実施、音楽と感情の関係の深い理解に適しています。

直接使用します:

https://hyper.ai/datasets/29133

6. miHoYo ミュージック リミックス ピアノ データセット MiHoYo ミュージック リミックス ピアノ データセット

このデータセットには主に次のものが含まれます ミホヨ  同社の 2 つのゲーム、「原神」と「本懐: スターレール」のピアノ ミュージック クリップ。これらのピアノの抜粋は ABC 楽譜に変換されています。研究者はこのリソースを使用して、音符やメロディーの構造などの音楽の特徴を詳細に分析し、音楽生成アルゴリズムのトレーニングと強化のための実質的なデータ サポートを提供できます。

直接使用します:

https://hyper.ai/datasets/29150

7. FMA音楽分析データセット

FMA は、HQ オーディオ全体、事前計算された特徴、トラックおよびユーザーレベルのメタデータで構成される音楽分析データ セットであり、MIR (音楽情報取得) の複数のタスクを評価するために使用できます。

直接使用します:

https://hyper.ai/datasets/29162

8. ハイスループットの藻類細胞検出 藻類細胞検出データセット

このデータ セットは、トレーニング セットとテスト セットを含む、2023 IEEE ネットワーク情報学会議「Vision Meets Algae」物体検出チャレンジからのものです。トレーニング セットには 700 枚の画像が含まれ、テスト セットには 300 枚の画像が含まれており、6 つのカテゴリに分割されています。トレーニング セットの注釈は YOLO 形式であり、各画像には .txt 形式の対応する注釈ファイルがあります。

直接使用します:

https://hyper.ai/datasets/29158

9. MathVista 数学的推論データセット

MathVista は、ビジュアル環境における包括的な数学的推論ベンチマークです。これは、新しく作成された 3 つのデータセット IQTest、FunctionQA、PaperQA で構成されており、それぞれパズル テスト グラフでの論理的推論、関数グラフでの代数的推論、学術論文のグラフでの科学的推論の評価に使用されます。 MathVista には、31 の異なるデータ セットから収集された合計 6,141 の例が含まれています。

直接使用します:

https://hyper.ai/datasets/29122

10. 動物 10種類の動物画像データセット

このデータセットには、犬、猫、馬、クモ、蝶、鶏、羊、牛、リス、象の 10 カテゴリに属する約 28,000 枚の中品質の動物画像が含まれています。さまざまな画像認識ネットワークをテストするために使用できます。

直接使用します:

https://hyper.ai/datasets/29079

サイエンスAI  厳選された紙ケース

1. AI はグリーン冷凍を強化し、香港の嶺南大学は建物の冷却負荷予測のための DEMMFL モデルを開発しています。

「機械および電気設備の構築のためのグローバル人工知能チャレンジ」では、香港の嶺南大学と香港城市大学の研究者が、建物の冷却負荷を正確に予測できる新しい動的に設計されたマルチモーダル特徴学習 (DEMMFL) モデルを提案しました。エネルギーの節約に役立ちます。関連論文が「」に掲載されています。応用エネルギー"ジャーナル。

レポート全体を表示します。

https://hyper.ai/news/29108

2. 自分自身を転がしますか? NVIDIA、チップ設計に合わせてカスタマイズされた大型モデル ChipNeMo をリリース

NVIDIA は、独自の内部データに基づいてトレーニングされた、カスタマイズされた大規模言語モデル ChipNeMo をリリースしました。これは、エンジニアがチップ設計に関連するタスクを完了するのに役立ちます。この記事では、ChipNeMo について詳しく説明します。

レポート全体を表示します。

https://hyper.ai/news/29134

人気のある百科事典の項目を厳選

1. 核の規範

2. 対応のある t 検定対応のある t 検定

3. 分散コンピューティング分散コンピューティング

4. 専門家の混合 (MoE)

5. 検索拡張生成 (RAG)

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。https://hyper.ai/wiki

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、メッセージを残すか、投稿してお知らせください。

また来週お会いしましょう!

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1,200 を超える公開データセットに対して国内の高速ダウンロード ノードを提供

* 300 以上の古典的で人気のあるオンライン チュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。https://hyper.ai/