iQIYI-VID 멀티모달 비디오 캐릭터 데이터 세트

iQIYI-VID는 다중 모드 비디오 문자 데이터 세트입니다. 이 데이터 세트에는 5,000명의 유명 아티스트와 500,000개의 비디오 클립이 포함되어 있으며, 각 비디오의 길이는 1~30초입니다. 총 길이는 1,000시간입니다. 이 영상 클립은 iQiyi의 예능 프로그램, 영화, TV 시리즈에서 따온 것입니다. 각 비디오 클립에는 수동으로 주석이 달려 있으며 오류율은 0.2% 미만입니다. 연구진은 iQIYI-VID 데이터세트에서 얼굴 인식, 인물 재식별, 화자 인식을 위한 최첨단 모델을 평가했습니다.