Clotho 音频字幕数据集

数据集下载 磁力链 下载帮助

Clotho 是一个 audio captioning 数据集。该数据集侧重于音频的内容,以及字幕的多样性,由 4,981 个音频样本组成,每个音频样本有 5 个字幕(总共 24,905 个字幕),持续时间为 15 到 30 秒,字幕长度为 8 到 20 个单词。

1 做种 0 下载 176 已完成
  • Clotho/README.md 1.03 KB
  • Clotho/README.txt 1.03 KB
  • Clotho/data/LICENSE 1.82 KB
  • Clotho/data/clotho_audio_development.7z 3.2 GB
  • Clotho/data/clotho_audio_evaluation.7z 1.16 GB
  • Clotho/data/clotho_captions_development.csv 978.61 KB
  • Clotho/data/clotho_captions_evaluation.csv 353.51 KB
  • Clotho/data/clotho_metadata_development.csv 610.2 KB
  • Clotho/data/clotho_metadata_evaluation.csv 220.03 KB