HyperAI초신경

YouTube-100M 비디오 분류 데이터 세트

날짜

3년 전

기관

Google

발행 주소

arxiv.org

라이선스

其他

다운로드 도움말
特色图像

YouTube-100M 데이터 세트에는 1억 개의 YouTube 동영상이 포함되어 있습니다. 여기에는 7,000만 개의 교육용 비디오, 1,000만 개의 평가용 비디오, 2,000만 개의 검증용 비디오가 포함됩니다. 각 영상의 평균 길이는 4.6분이며, 총 540만 시간의 교육이 필요합니다.

데이터 세트에는 30,000개 이상의 카테고리 주석이 포함되어 있으며, 이는 각 비디오의 메타데이터(제목, 설명, 댓글 등), 배경 및 이미지 콘텐츠를 조합하여 자동 생성됩니다. 평균적으로 영상당 약 5개의 주석이 있습니다.