Casual Conversations 旨在帮助研究人员评估其计算机视觉和音频模型在各种年龄、性别、明显的肤色和周围光线条件下的准确性,以消除 AI 偏见。
该数据集包含了 3,011 名参与者的 45,000 多个视频,均匀分布了不同的性别、年龄段和肤色。
Facebook 要求其中的付费参与者提交视频并自己提供了年龄和性别标签,以尽可能地消除误差。此外,Facebook 还为 Casual Conversations 招募了一些训练有素的标注员。这些标注员在每个视频中标注了光照水平,以帮助衡量 AI 模型在低光环境条件下如何对待不同肤色的人。