Casual Conversations 语音识别数据集

该数据集暂无下载资源提供,我们正在积极的准备提供更多的数据集

Casual Conversations 旨在帮助研究人员评估其计算机视觉和音频模型在各种年龄、性别、明显的肤色和周围光线条件下的准确性,以消除 AI 偏见。

该数据集包含了 3,011 名参与者的 45,000 多个视频,均匀分布了不同的性别、年龄段和肤色。

Facebook 要求其中的付费参与者提交视频并自己提供了年龄和性别标签,以尽可能地消除误差。此外,Facebook 还为 Casual Conversations 招募了一些训练有素的标注员。这些标注员在每个视频中标注了光照水平,以帮助衡量 AI 模型在低光环境条件下如何对待不同肤色的人。