2달 전

CelebV-HQ: 대규모 비디오 얼굴 속성 데이터셋

Hao Zhu; Wayne Wu; Wentao Zhu; Liming Jiang; Siwei Tang; Li Zhang; Ziwei Liu; Chen Change Loy
CelebV-HQ: 대규모 비디오 얼굴 속성 데이터셋
초록

대규모 데이터셋은 최근 얼굴 생성/편집의 성공에 필수적인 역할을 하였으며, 새로운 연구 분야의 발전을 크게 촉진하였습니다. 그러나 학계는 여전히 다양한 얼굴 속성 주석이 포함된 비디오 데이터셋이 부족하여, 이는 얼굴 관련 비디오 연구에 중요한 부분입니다. 본 연구에서는 풍부한 얼굴 속성 주석을 가진 대규모, 고품질, 다양성 있는 비디오 데이터셋인 고품질 유명인 비디오 데이터셋(CelebV-HQ)을 제안합니다. CelebV-HQ는 최소 512x512 해상도를 가진 35,666개의 비디오 클립으로 구성되어 있으며, 15,653명의 개인을 포함하고 있습니다. 모든 클립은 외모, 행동, 감정 등 83가지의 얼굴 속성을 수동으로 라벨링하였습니다. 우리는 연령, 인종, 밝기 안정성, 움직임 부드러움, 머리 자세 다양성 및 데이터 품질 측면에서 종합적인 분석을 수행하여 CelebV-HQ의 다양성과 시간적 일관성을 입증하였습니다. 또한 무조건적 비디오 생성과 비디오 얼굴 속성 편집이라는 두 가지 대표적인 작업에서 CelebV-HQ의 다용도성과 잠재력을 검증하였습니다. 더 나아가 우리는 CelebV-HQ의 미래 잠재력과 함께 이 데이터셋이 관련 연구 방향에 가져올 새로운 기회와 도전에 대해 전망합니다. 데이터, 코드 및 모델은 공개적으로 이용 가능합니다. 프로젝트 페이지: https://celebv-hq.github.io.

CelebV-HQ: 대규모 비디오 얼굴 속성 데이터셋 | 최신 연구 논문 | HyperAI초신경