Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

AIによる音楽トレーニングの効率化を図るため、CCMusic は、計算音楽学の研究者が自由に使用できるように、いくつかの音楽およびオーディオデータセットをオープンソース化しました。現在は hyper.ai 上で稼働しています。さらに、hyper.ai は MiHoYo や NetEase Cloud などの関連音楽データセットも更新しました。見てみましょう。

1 月 22 日から 1 月 26 日までの hyper.ai 公式 Web サイトの更新の概要:

※高品質な公開データセット：10件

※AI4S紙ケース：2枚

* 人気のある百科事典のエントリ: 10

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. CCMUSIC 本当の声と裏声のデータセット

このデータセットには、チェストボイスとファルセットの 1,280 個のモノラル歌唱オーディオ (.wav 形式) が含まれており、チェストボイスはチェストボイス、ファルセットはファルセットとラベル付けされています。

直接使用します:

https://hyper.ai/datasets/29125

2. CCMUSICピアノ音質データセット

このデータセットには、中国音楽院のピアノ室にある 7 種類のピアノ (河合アップライトピアノ、河合グランドピアノ、永昌アップライトピアノ、星海アップライトピアノ、スタインウェイグランドシアターグランドピアノ、スタインウェイグランドピアノ、珠江アップライトピアノ) が含まれています。 ) 12 の色域オーディオファイル (.wav / .mp3 / .m4a 形式) と 1320 のスプリットモノラルオーディオファイル (.wav / .mp3 / .m4a 形式)、合計 1332 ファイル。さらに、ピアノ音質の主観評価アンケート (.xls 形式) があり、ピアノ音質の主観評価に参加した 29 人の評価が含まれています。

直接使用します:

https://hyper.ai/datasets/29097

3. CCMUSIC 音楽ジャンルデータセット

データセットには、長さ270～300秒、合計17ジャンルに分かれた約1700曲（.mp3形式）が収録されています。オリジナルの音楽には著作権の問題があるため、データセットではスペクトログラムのみが提供されています。

直接使用します:

https://hyper.ai/datasets/29094

4. CCMUSIC ベルカント民族歌唱データセット

このデータセットには、プロの歌手がベルコントと中国民謡の 2 つのスタイルで歌った数百ものアカペラの抜粋が含まれています。すべてのクリップはプロの歌手によって歌われ、プロの商業レコーディングスタジオで録音されています。

直接使用します:

https://hyper.ai/datasets/29086

5. NetEase Cloudの音楽感情分類データセット

このデータセットには、約 395,000 個の音楽感情ラベルデータが含まれており、各データは、曲 ID、プレイリスト ID、および曲感情ラベルの 3 つの主要な列で構成されます。これらのデータのソースは NetEase Cloud Music の公式 Web サイトであり、曲の感情のラベル付けに関する詳細情報が提供されています。データセットのサイズが大きいため、感情分析モデルの構築、データマイニングの実施、音楽と感情の関係の深い理解に適しています。

直接使用します:

https://hyper.ai/datasets/29133

6. miHoYo ミュージックリミックスピアノデータセット MiHoYo ミュージックリミックスピアノデータセット

このデータセットには主に次のものが含まれますミホヨ同社の 2 つのゲーム、「原神」と「本懐: スターレール」のピアノミュージッククリップ。これらのピアノの抜粋は ABC 楽譜に変換されています。研究者はこのリソースを使用して、音符やメロディーの構造などの音楽の特徴を詳細に分析し、音楽生成アルゴリズムのトレーニングと強化のための実質的なデータサポートを提供できます。

直接使用します:

https://hyper.ai/datasets/29150

7. FMA音楽分析データセット

FMA は、HQ オーディオ全体、事前計算された特徴、トラックおよびユーザーレベルのメタデータで構成される音楽分析データセットであり、MIR (音楽情報取得) の複数のタスクを評価するために使用できます。

直接使用します:

https://hyper.ai/datasets/29162

8. ハイスループットの藻類細胞検出藻類細胞検出データセット

このデータセットは、トレーニングセットとテストセットを含む、2023 IEEE ネットワーク情報学会議「Vision Meets Algae」物体検出チャレンジからのものです。トレーニングセットには 700 枚の画像が含まれ、テストセットには 300 枚の画像が含まれており、6 つのカテゴリに分割されています。トレーニングセットの注釈は YOLO 形式であり、各画像には .txt 形式の対応する注釈ファイルがあります。

直接使用します:

https://hyper.ai/datasets/29158

9. MathVista 数学的推論データセット

MathVista は、ビジュアル環境における包括的な数学的推論ベンチマークです。これは、新しく作成された 3 つのデータセット IQTest、FunctionQA、PaperQA で構成されており、それぞれパズルテストグラフでの論理的推論、関数グラフでの代数的推論、学術論文のグラフでの科学的推論の評価に使用されます。 MathVista には、31 の異なるデータセットから収集された合計 6,141 の例が含まれています。

直接使用します:

https://hyper.ai/datasets/29122

10. 動物 10種類の動物画像データセット

このデータセットには、犬、猫、馬、クモ、蝶、鶏、羊、牛、リス、象の 10 カテゴリに属する約 28,000 枚の中品質の動物画像が含まれています。さまざまな画像認識ネットワークをテストするために使用できます。

直接使用します:

https://hyper.ai/datasets/29079

サイエンスAI 厳選された紙ケース

1. AI はグリーン冷凍を強化し、香港の嶺南大学は建物の冷却負荷予測のための DEMMFL モデルを開発しています。

「機械および電気設備の構築のためのグローバル人工知能チャレンジ」では、香港の嶺南大学と香港城市大学の研究者が、建物の冷却負荷を正確に予測できる新しい動的に設計されたマルチモーダル特徴学習 (DEMMFL) モデルを提案しました。エネルギーの節約に役立ちます。関連論文が「」に掲載されています。応用エネルギー"ジャーナル。

レポート全体を表示します。

https://hyper.ai/news/29108

2. 自分自身を転がしますか？ NVIDIA、チップ設計に合わせてカスタマイズされた大型モデル ChipNeMo をリリース

NVIDIA は、独自の内部データに基づいてトレーニングされた、カスタマイズされた大規模言語モデル ChipNeMo をリリースしました。これは、エンジニアがチップ設計に関連するタスクを完了するのに役立ちます。この記事では、ChipNeMo について詳しく説明します。

レポート全体を表示します。

https://hyper.ai/news/29134

Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

2年前

情報

サイエンスのためのAI

データセット

1 月 22 日から 1 月 26 日までの hyper.ai 公式 Web サイトの更新の概要:

※高品質な公開データセット：10件

※AI4S紙ケース：2枚

* 人気のある百科事典のエントリ: 10

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. CCMUSIC 本当の声と裏声のデータセット

直接使用します:

https://hyper.ai/datasets/29125

2. CCMUSICピアノ音質データセット

直接使用します:

https://hyper.ai/datasets/29097

3. CCMUSIC 音楽ジャンルデータセット

直接使用します:

https://hyper.ai/datasets/29094

4. CCMUSIC ベルカント民族歌唱データセット

直接使用します:

https://hyper.ai/datasets/29086

5. NetEase Cloudの音楽感情分類データセット

直接使用します:

https://hyper.ai/datasets/29133

6. miHoYo ミュージックリミックスピアノデータセット MiHoYo ミュージックリミックスピアノデータセット

直接使用します:

https://hyper.ai/datasets/29150

7. FMA音楽分析データセット

直接使用します:

https://hyper.ai/datasets/29162

8. ハイスループットの藻類細胞検出藻類細胞検出データセット

直接使用します:

https://hyper.ai/datasets/29158

9. MathVista 数学的推論データセット

直接使用します:

https://hyper.ai/datasets/29122

10. 動物 10種類の動物画像データセット

直接使用します:

https://hyper.ai/datasets/29079

サイエンスAI 厳選された紙ケース

1. AI はグリーン冷凍を強化し、香港の嶺南大学は建物の冷却負荷予測のための DEMMFL モデルを開発しています。

レポート全体を表示します。

https://hyper.ai/news/29108

2. 自分自身を転がしますか？ NVIDIA、チップ設計に合わせてカスタマイズされた大型モデル ChipNeMo をリリース

レポート全体を表示します。

https://hyper.ai/news/29134

Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

2年前

情報

サイエンスのためのAI

データセット

1 月 22 日から 1 月 26 日までの hyper.ai 公式 Web サイトの更新の概要:

※高品質な公開データセット：10件

※AI4S紙ケース：2枚

* 人気のある百科事典のエントリ: 10

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. CCMUSIC 本当の声と裏声のデータセット

直接使用します:

https://hyper.ai/datasets/29125

2. CCMUSICピアノ音質データセット

直接使用します:

https://hyper.ai/datasets/29097

3. CCMUSIC 音楽ジャンルデータセット

直接使用します:

https://hyper.ai/datasets/29094

4. CCMUSIC ベルカント民族歌唱データセット

直接使用します:

https://hyper.ai/datasets/29086

5. NetEase Cloudの音楽感情分類データセット

直接使用します:

https://hyper.ai/datasets/29133

6. miHoYo ミュージックリミックスピアノデータセット MiHoYo ミュージックリミックスピアノデータセット

直接使用します:

https://hyper.ai/datasets/29150

7. FMA音楽分析データセット

直接使用します:

https://hyper.ai/datasets/29162

8. ハイスループットの藻類細胞検出藻類細胞検出データセット

直接使用します:

https://hyper.ai/datasets/29158

9. MathVista 数学的推論データセット

直接使用します:

https://hyper.ai/datasets/29122

10. 動物 10種類の動物画像データセット

直接使用します:

https://hyper.ai/datasets/29079

サイエンスAI 厳選された紙ケース

1. AI はグリーン冷凍を強化し、香港の嶺南大学は建物の冷却負荷予測のための DEMMFL モデルを開発しています。

レポート全体を表示します。

https://hyper.ai/news/29108

2. 自分自身を転がしますか？ NVIDIA、チップ設計に合わせてカスタマイズされた大型モデル ChipNeMo をリリース

レポート全体を表示します。

https://hyper.ai/news/29134

Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

公開データセットの選択

サイエンスAI 厳選された紙ケース

人気のある百科事典の項目を厳選

Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

公開データセットの選択

サイエンスAI 厳選された紙ケース

人気のある百科事典の項目を厳選

関連ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

データセット集｜医用画像データ／臨床データから細胞アトラス／医療Q&Aまで、複数の疾患シナリオを網羅する10の主要データセット

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

公開データセットの選択

サイエンスAI 厳選された紙ケース

人気のある百科事典の項目を厳選

関連ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

データセット集｜医用画像データ／臨床データから細胞アトラス／医療Q&Aまで、複数の疾患シナリオを網羅する10の主要データセット

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

関連ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

データセット集｜医用画像データ／臨床データから細胞アトラス／医療Q&Aまで、複数の疾患シナリオを網羅する10の主要データセット

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

関連ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

データセット集｜医用画像データ／臨床データから細胞アトラス／医療Q&Aまで、複数の疾患シナリオを網羅する10の主要データセット

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

Command Palette

Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

公開データセットの選択

サイエンスAI 厳選された紙ケース

人気のある百科事典の項目を厳選

Command Palette

Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

公開データセットの選択

サイエンスAI 厳選された紙ケース

人気のある百科事典の項目を厳選

関連 ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

データセット集｜医用画像データ／臨床データから細胞アトラス／医療Q&Aまで、複数の疾患シナリオを網羅する10の主要データセット

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

Command Palette

Weekly Editor's Selection | CCMusic 音楽データセットがオンラインで、NVIDIA の自社開発大型モデル ChipNeMo が明らかに

公開データセットの選択

サイエンスAI 厳選された紙ケース

人気のある百科事典の項目を厳選

関連 ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

データセット集｜医用画像データ／臨床データから細胞アトラス／医療Q&Aまで、複数の疾患シナリオを網羅する10の主要データセット

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

関連 ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

データセット集｜医用画像データ／臨床データから細胞アトラス／医療Q&Aまで、複数の疾患シナリオを網羅する10の主要データセット

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

関連 ニュース

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

データセット集｜医用画像データ／臨床データから細胞アトラス／医療Q&Aまで、複数の疾患シナリオを網羅する10の主要データセット

テンセントがHy-MT1.5翻訳モデルをオープンソース化：440MBで最高レベルの翻訳能力を実現。MITがMathNetを共同リリース：27,000の実際のオリンピック数学問題を網羅したマルチモーダル数学推論ベンチマーク。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

関連ニュース

関連ニュース

関連ニュース

関連ニュース