LSMDC 비디오 설명 데이터 세트

LSMDC는 대규모 영화 설명 챌린지를 뜻합니다. 이 데이터 세트에는 202개의 영화에서 추출한 118,081개의 짧은 비디오 클립이 포함되어 있습니다. 각 영상에는 영화 대본에서 추출한 자막이 함께 제공되거나 시각 장애인을 위해 DVS(Dictation Video Service)를 사용하여 필사한 자막이 제공됩니다.
검증 세트에는 7,408개의 비디오 클립이 포함되어 있으며, 평가는 훈련 및 검증 세트와 겹치지 않는 1,000개의 영화 비디오로 구성된 테스트 세트에서 수행됩니다.