HyperAI
Command Palette
Search for a command to run...
ViTT Dense 비디오 설명 데이터 세트

ViTT는 비디오 타임라인 태그를 의미하며, 수동으로 생성된 세그먼트 수준의 주석이 포함된 8,169개의 비디오로 구성되어 있습니다. 이 중 5,840개의 영상은 한 번 주석이 달렸고, 나머지 영상은 두 번 이상 주석이 달렸습니다. 이 데이터 세트에 대해 총 12,461개의 주석 세트가 공개되었습니다. 이 데이터 세트의 비디오는 Youtube-8M 데이터 세트에서 가져왔습니다.
이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.