HyperAIHyperAI

Command Palette

Search for a command to run...

iQIYI-VID Multimodaler Videozeichendatensatz

Datum

vor 3 Jahren

Organisation

Veröffentlichungs-URL

challenge.ai.iqiyi.com

Paper-URL

arxiv.org

Lizenz

Andere

Treten Sie der Discord-Community bei
Featured Image

iQIYI-VID ist ein multimodaler Videozeichendatensatz. Der Datensatz enthält 5.000 berühmte Künstler und 500.000 Videoclips mit einer Gesamtlänge von 1.000 Stunden, wobei jedes Video 1 bis 30 Sekunden lang ist. Die Videoclips stammen aus Varietéshows, Filmen und Fernsehserien von iQiyi. Jeder Videoclip wird manuell mit einer Fehlerrate von weniger als 0,2 % kommentiert. Die Forscher evaluierten modernste Modelle zur Gesichtserkennung, Personenidentifizierung und Sprechererkennung anhand des iQIYI-VID-Datensatzes.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
iQIYI-VID Multimodaler Videozeichendatensatz | Datensätze | HyperAI