日付

2年前

サイズ

120.7 MB

データセット構成

公開URL

github.com

Paper URL

openreview.net

ライセンス

CC BY 4.0

タグ

音声認識

音声分類

このデータセットは、ノースウェスタン理工大学、西安連峰音響技術有限公司、南洋理工大学、サリー大学、中国科学院音響研究所の研究者らによって2024年に発表された。関連する論文の結果は次のとおりである。」AudioSetCaps: 大規模な音声言語モデルを使用した強化された音声キャプションデータセットの生成」が NeurIPS 24 に受理されました。 AudioSetCaps は、6,117,099 個の 10 秒オーディオファイルを含むオーディオキャプションデータセットです。各オーディオファイルには、最終的なタイトルを生成するためのメタデータとして、説明的なタイトルと 3 つの Q&A ペアが付いています (合計 18,414,789 ペアの Q&A データ)。これは、AudioSet、YouTube-8M、VGGSound の 3 つのオーディオデータセットのデータを使用して、大規模なオーディオおよび言語モデルを使用した自動生成パイプラインを通じて作成されます。

AudioSetCaps.torrent

シーディング 2ダウンロード中 0完了 125総ダウンロード数 258

AudioSetCaps/
- README.md
  1.63 KB
- README.txt
  3.27 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

120.7 MB

データセット構成

公開URL

github.com

Paper URL

openreview.net

ライセンス

CC BY 4.0

タグ

音声認識

音声分類

AudioSetCaps.torrent

シーディング 2ダウンロード中 0完了 125総ダウンロード数 258

AudioSetCaps/
- README.md
  1.63 KB
- README.txt
  3.27 KB

地上情報源による世界洪水イベントデータセット

3ヶ月前

RubricHub_v1 マルチドメイン生成タスクデータセット

5ヶ月前

RoVid-X ロボットビデオ生成データセット

2ヶ月前

LightOnOCR-mix-0126 テキスト転写データセット

5ヶ月前

TxT360-3efforts マルチタスク推論データセット

6ヶ月前

X線密輸品検出データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボットビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボットビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボットビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

関連データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボットビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

Command Palette

AudioSetCaps オーディオ字幕データ セット

AIでAIを構築

HyperAI Newsletters

Command Palette

AudioSetCaps オーディオ字幕データ セット

関連データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

AudioSetCaps オーディオ字幕データ セット

関連データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

関連データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AudioSetCaps オーディオ字幕データセット

AudioSetCaps オーディオ字幕データセット

RoVid-X ロボットビデオ生成データセット

AudioSetCaps オーディオ字幕データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット