2ヶ月前

CelebV-HQ: 大規模なビデオ顔属性データセット

Hao Zhu; Wayne Wu; Wentao Zhu; Liming Jiang; Siwei Tang; Li Zhang; Ziwei Liu; Chen Change Loy
CelebV-HQ: 大規模なビデオ顔属性データセット
要約

大規模データセットは、顔生成/編集の最近の成功において不可欠な役割を果たし、新興研究分野の進歩を大幅に促進してきました。しかし、学術界では多様な顔属性アノテーションを持つビデオデータセットがまだ不足しており、これは顔関連ビデオの研究にとって重要な課題となっています。本研究では、豊富な顔属性アノテーションを持つ大規模で高品質かつ多様なビデオデータセットを提案します。このデータセットは「High-Quality Celebrity Video Dataset (CelebV-HQ)」と名付けられました。CelebV-HQには、少なくとも512x512ピクセルの解像度を持つ35,666個のビデオクリップが含まれており、15,653人のアイデンティティが登場します。すべてのクリップは83種類の顔属性(外見、動作、感情)について手動でラベリングされています。年齢、民族性、明るさの安定性、動きの滑らかさ、頭部姿勢の多様性、データ品質という観点から包括的な分析を行い、CelebV-HQの多様性と時間的一貫性を示しています。さらに、無条件ビデオ生成とビデオ顔属性編集という2つの代表的なタスクにおいてその汎用性と潜在能力を検証しました。また、CelebV-HQが将来持つ可能性や関連する研究方向に新たな機会と課題をもたらすことを展望しています。データ、コード、モデルは公開されています。プロジェクトページ: https://celebv-hq.github.io.

CelebV-HQ: 大規模なビデオ顔属性データセット | 最新論文 | HyperAI超神経