HyperAI

YouTube-100M-Videoklassifizierungsdatensatz

Datum

vor 3 Jahren

Organisation

Google

Veröffentlichungs-URL

arxiv.org

Lizenz

其他

Download-Hilfe
特色图像

Der YouTube-100M-Datensatz enthält 100 Millionen YouTube-Videos. Dazu gehören 70 Millionen Schulungsvideos, 10 Millionen Evaluierungsvideos und 20 Millionen Validierungsvideos. Jedes Video ist im Durchschnitt 4,6 Minuten lang, was insgesamt 5,4 Millionen Trainingsstunden entspricht.

Der Datensatz enthält über 30.000 Kategorieanmerkungen, die automatisch basierend auf einer Kombination aus Metadaten (Titel, Beschreibung, Kommentare usw.), Hintergrund und Bildinhalt jedes Videos generiert werden. Im Durchschnitt gibt es etwa 5 Anmerkungen pro Video.