日期
大小
机构
发布地址
zenodo.org
许可协议
其他
标签
国外高校
多任务学习
语言建模
分类
自然语言处理
Clotho 是一个 audio captioning 数据集。该数据集侧重于音频的内容,以及字幕的多样性,由 4,981 个音频样本组成,每个音频样本有 5 个字幕(总共 24,905 个字幕),持续时间为 15 到 30 秒,字幕长度为 8 到 20 个单词。
做种 1
下载中 0
已完成 474
总下载 531