HyperAIHyperAI

Command Palette

Search for a command to run...

iQIYI-VID Multimodaler Videozeichendatensatz

Discuss on Discord

Date

vor 3 Jahren

Organization

Paper URL

arxiv.org

License

Other

Featured Image

iQIYI-VID ist ein multimodaler Videozeichendatensatz. Der Datensatz enthält 5.000 berühmte Künstler und 500.000 Videoclips mit einer Gesamtlänge von 1.000 Stunden, wobei jedes Video 1 bis 30 Sekunden lang ist. Die Videoclips stammen aus Varietéshows, Filmen und Fernsehserien von iQiyi. Jeder Videoclip wird manuell mit einer Fehlerrate von weniger als 0,2 % kommentiert. Die Forscher evaluierten modernste Modelle zur Gesichtserkennung, Personenidentifizierung und Sprechererkennung anhand des iQIYI-VID-Datensatzes.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp