YouTube-8M-beschrifteter Videodatensatz
Datum
Größe
Veröffentlichungs-URL
Lizenz
非商业用途
Kategorien
YouTube – 8M ist ein großer beschrifteter Videodatensatz, der aus Millionen von YouTube-Video-IDs besteht. Die darin enthaltenen mehr als 3.800 visuellen Entitätsanmerkungen werden alle maschinell auf der Grundlage eines Vokabulars generiert. Da der Datensatz vorkalkuliert ist, kann er auf einer einzigen Festplatte verwendet werden. Das bedeutet, dass mit einer einzigen GPU ein Basismodell auf dem Datensatz trainiert werden kann.
Gleichzeitig ermöglichen der Umfang und die Vielfalt des Datensatzes den Benutzern eine eingehende Untersuchung komplexer audiovisueller Modelle, deren Training selbst bei verteiltem Training Wochen dauern würde.
Dieser Datensatz wurde 2016 von Google veröffentlicht.