
초록
이 논문은 저레벨 비디오 작업인 비디오 프레임 인터폴레이션(VFI)을 위한 대규모 비디오 인터폴레이션 벤치마크(LAVIB)를 소개합니다. LAVIB는 최소한의 인간 검증 요구사항으로 자동 파이프라인을 통해 웹에서 수집된 고해상도 비디오들의 큰 모음을 포함하고 있습니다. 각 비디오의 운동 크기, 루미넌스 조건, 프레임 선명도 및 대비를 측정하기 위한 지표가 계산되었습니다. 이러한 지표를 기반으로 한 양적 도전 과제와 비디오 컬렉션은 현재 저레벨 비디오 작업 데이터셋에서 충분히 탐구되지 않았습니다. 총합하여 LAVIB는 17,000개의 초고화질(Ultra-HD) 비디오에서 283,000개의 클립을 포함하며, 77.6시간에 해당합니다. 벤치마크의 학습용, 검증용 및 테스트용 세트는 유사한 비디오 지표 분포를 유지하고 있습니다. 또한 분포 외(out-of-distribution, OOD) 도전 과제를 위해 추가적인 분할이 생성되었으며, 학습용과 테스트용 분할은 서로 다른 속성을 가진 비디오들을 포함하고 있습니다.