SUN09 数据集由 12,000 张带标注的图像组成,包含 200 多个对象类别。该数据集包含了自然、室内和室外图像。每幅图像平均包含 7 个不同的标注对象,每个对象的平均占用面积是图像大小的 5 % 。物体类别的频率遵循幂律分布。
该数据集包含了两大基准:
- 用于评估总体的目标识别系统,其中包含:
- static_sun09_database:12,000 个带标注的图像
- static_sun_objects:用于训练基线检测器的附加图像(不用于训练上下文模型)
- out_of_context:42 张脱离上下文的图像
2. 用于评估具有预先计算的基线检测器输出的上下文模型,其中包含:
- 文件名对应 [( test / train )/ objectCategory / imageName.txt ]
- 文本文件中的每一行都显示了一个候选窗口的边界框位置和分数:[ x1 y1 x2 y2 score ]
- 我们使用 4,367 张训练图像和 4,317 张测试图像。每组每个场景类别具有相同数量的图像。
- 为基线检测器输出加载 sun09_detectorOutputs.mat ,为真实标注加载 sun09_groundTruth.mat 。
该数据集由麻省理工大学在 2010 年 IEEE CVPR 上发表。