FoodX-251 食物图像分类数据集

FoodX-251 是包含 251 个细粒度类别的食物图像数据集,有 120,216 张训练图像, 12,170 张验证图像和 228,399 张测试图像。训练图像带有杂音标签,验证图像和测试图像带有经人工验证的标签。这些种类是细粒度的且在视觉上是相似的,例如不同类型的蛋糕、三明…

TIMIT 方言录音数据集

TIMIT 数据集由 8 种主要美国英语方言共 630 个录音片段组成,其中每个方言都有 10 个语音丰富的句子。 TIMIT 语料库包括时间对齐的正交,语音和单词转录以及每个话语的 16kHz 语音波形文件。 该数据集由麻省理工学院、SRI 国际和德州仪器公司于 1993 年发…

TIMIT 语音读取语料数据集

TIMIT 语音读取语料数据集是一套声学-音素连续语音语料库,其旨在为声学语音研究以及自动语音识别系统的开发与评估提供语音数据。 TIMIT 一共包含 6300 个句子,每段音频的语音采样频率为 16kHz,包含由八种主要美国英语方言组成的 630 个录音片段,每个方言都有 10…