FLIC は、映画のフレームにタグ付けされた人物の画像データセットで、主流のハリウッド映画から収集された 5003 枚の画像が含まれています。
トレーニング画像は、30 個のムービーで実行されている文字検出器から取得され、画像が取得された後、上半身の 10 個の関節を含めて手動で注釈が付けられます。また、外れ値の注釈の堅牢性を確保するために、画像には 5 つの中央値マーカーが含まれています。出版社は、20% の約 1016 枚の画像をテスト用に確保することに加え、人物が隠れている画像や解像度の低い画像を積極的に拒否する予定です。
このデータセットは、ペンシルバニア大学工学応用科学部の GRASP 研究所によって 2013 年にリリースされました。関連する論文は「MODEC: Multimodal Decomposable Models for Human Pose Estimation」です。
做种 2
下载中 0
已完成 738
总下载 1,264