SUN09 データセットは 12,000 枚の注釈付き画像で構成され、200 を超えるオブジェクト カテゴリが含まれています。このデータセットには、自然、屋内、屋外の画像が含まれています。各画像には平均 7 つの異なる注釈付きオブジェクトが含まれており、各オブジェクトが占める平均領域は画像サイズの 5 % です。オブジェクト カテゴリの頻度はべき乗則分布に従います。
このデータセットには、次の 2 つの主要なベンチマークが含まれています。
- 母集団を評価するために使用されるターゲット認識システムには、次のものが含まれます。
- static_sun09_database: 12,000 個の注釈付き画像
- static_sun_objects: ベースライン検出器のトレーニングに使用される追加の画像 (コンテキスト モデルのトレーニングには使用されません)
- out_of_context: 文脈から外れた 42 枚の画像
2. 以下を含む事前計算されたベースライン検出器出力を使用してコンテキスト モデルを評価する場合。
- ファイル名は[( test / train )/ objectCategory / imageName.txt ]に相当します。
- テキスト ファイルの各行は、境界ボックスの位置と候補ウィンドウのスコアを示します: [ x1 y1 x2 y2 スコア ]
- 4,367 枚のトレーニング画像と 4,317 枚のテスト画像を使用します。各グループには、シーン カテゴリごとに同じ数の画像があります。
- ベースライン検出器の出力には sun09_detectorOutputs.mat をロードし、グラウンド トゥルース アノテーションには sun09_groundTruth.mat をロードします。
このデータセットは、2010 IEEE CVPR で MIT によって公開されました。