VidSTG 대규모 비디오 접지 데이터 세트

VidSTG 데이터 세트는 VidOR 데이터 세트를 기반으로 구축된 시공간적 비디오 접지 데이터 세트입니다. VidOR는 각각 훈련, 검증 및 테스트를 위해 7,000개, 835개 및 2,165개의 비디오를 포함하는 비디오 관계 데이터 세트입니다. 시공간 비디오 접지 작업의 목표는 대상을 설명하는 주어진 문장과 일치하는, 다듬어지지 않은 비디오의 시공간적 부분을 찾아내는 것입니다.
VidSTG 데이터 세트는 VidOR 데이터 세트를 기반으로 구축된 시공간적 비디오 접지 데이터 세트입니다. VidOR는 각각 훈련, 검증 및 테스트를 위해 7,000개, 835개 및 2,165개의 비디오를 포함하는 비디오 관계 데이터 세트입니다. 시공간 비디오 접지 작업의 목표는 대상을 설명하는 주어진 문장과 일치하는, 다듬어지지 않은 비디오의 시공간적 부분을 찾아내는 것입니다.