2R 비디오 검색 데이터 세트

2R은 텍스트 기반 비디오 검색에 대한 데이터 세트입니다. 이 데이터 세트에는 HowTo 100M 데이터 세트의 9,371개 비디오에서 수집한 60초 클립 24,328개와 관련 쿼리 용어 51,390개가 포함되어 있으며, 클립당 평균 관련 쿼리 용어는 2~3개입니다. 이 중 80% 데이터는 학습에 사용되고, 10% 데이터는 검증에 사용되고, 10% 데이터는 테스트에 사용됩니다.
How 2R과 How 2QA는 비디오 검색 및 비디오 질의응답 분야를 연구하는 데 사용할 수 있는 새로운 도전적인 벤치마크입니다.