Command Palette
Search for a command to run...
iQIYI-VID Multimodaler Videozeichendatensatz
Date
Publish URL
Paper URL
License
Other

iQIYI-VID ist ein multimodaler Videozeichendatensatz. Der Datensatz enthält 5.000 berühmte Künstler und 500.000 Videoclips mit einer Gesamtlänge von 1.000 Stunden, wobei jedes Video 1 bis 30 Sekunden lang ist. Die Videoclips stammen aus Varietéshows, Filmen und Fernsehserien von iQiyi. Jeder Videoclip wird manuell mit einer Fehlerrate von weniger als 0,2 % kommentiert. Die Forscher evaluierten modernste Modelle zur Gesichtserkennung, Personenidentifizierung und Sprechererkennung anhand des iQIYI-VID-Datensatzes.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.