STEP は The Segmenting and Tracking Every Pixel ベンチマークの略で、21 のトレーニング シーケンスと 29 のテスト シーケンスが含まれます。このデータセットは、KITTI Tracking Evaluation および Multi-Object Tracking and Segmentation (MOTS) ベンチマークに基づいています。
このデータセットは、各ピクセルに高密度ピクセル セグメンテーション ラベルを追加します。このベンチマークでは、各ピクセルにはセマンティック ラベルがあり、最も顕著なオブジェクト カテゴリ (車と歩行者) に属するすべてのピクセルには一意の追跡 ID があります。