V-COCO 人体インタラクション検出データセット

V-COCO (Verbs in COCO の完全名) は、MS COCO データ セットに基づくデータ セットであり、人とオブジェクトの間のインタラクション検出に使用されます。
このデータセットは、10,346 枚の画像 (トレーニング用 2,533 枚、検証用 2,867 枚、テスト用 4,946 枚) と 16,199 人の人物インスタンスを提供します。各キャラクターには 29 のアクション カテゴリからの注釈が付いています。このデータセットには、オブジェクトを含むインタラクション ラベルがありません。