HyperAIHyperAI

Command Palette

Search for a command to run...

VidProM Großer Datensatz Für Text-zu-Video-Eingabeaufforderungen

Auf Discord diskutieren

Datum

vor 2 Jahren

Organisation

Zhejiang-Universität
Featured Image

Der VidProM-Datensatz ist der erste groß angelegte Datensatz zur Text-zu-Video-Eingabeaufforderung für echte Benutzer, der gemeinsam von der University of Technology Sydney und der Zhejiang University entwickelt wurde. Es enthält 1,67 Millionen einzigartige Text-zu-Video-Aufforderungen und 6,69 Millionen Videos, die von vier hochmodernen Diffusionsmodellen generiert wurden.

Der Datensatz bietet nicht nur eine große Menge an Videoinhalten, sondern enthält auch die mit jeder Eingabeaufforderung verbundene NSFW-Wahrscheinlichkeit (Not Safe For Work), 3072-dimensionale Eingabeaufforderungseinbettungen und zusätzliche zugehörige Metadaten. Der Erstellungsprozess umfasst das Sammeln von HTML-Quelldateien, das Extrahieren und Einbetten von Texthinweisen, das Zuweisen von NSFW-Wahrscheinlichkeiten zu diesen Hinweisen, das Crawlen und Generieren von Videos und schließlich das Herausfiltern semantisch eindeutiger Hinweise.

Die Veröffentlichung von VidProM zielt darauf ab, die Forschung im Bereich der Text-zu-Video-Generierung zu fördern und Aspekte wie Modellbewertung, effiziente Videogenerierung, Erkennung gefälschter Videos und Erkennung von Video-Urheberrechten abzudecken. Forschern werden dadurch wertvolle Ressourcen zur Erforschung und Entwicklung neuer Techniken zur Text-zu-Video-Generierung bereitgestellt.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp