Command Palette
Search for a command to run...
Benchmark-Datensatz Für DREAM-1K-Videobeschreibungen
DREAM-1K ist ein von ByteDance veröffentlichter Benchmark-Datensatz für Videobeschreibungen. Die zugehörigen Ergebnisse sind:Tarsier: Rezepte zum Trainieren und Auswerten großer Videobeschreibungsmodelle".
Der Datensatz enthält 1.000 kommentierte Videoclips (ca. 10 Sekunden lang) unterschiedlicher Komplexität aus fünf verschiedenen Kategorien. Jeder Clip enthält mindestens ein dynamisches Ereignis, das anhand eines einzelnen Frames nicht eindeutig identifiziert werden kann. Jedes Video ist mit detaillierten manuellen Anmerkungen versehen, die alle Ereignisse, Aktionen und Bewegungen abdecken.
Datenquellenkategorie:
- Realfilme
- Animationsfilme
- Stockvideo
- Lange YouTube-Videos
- Kurzvideos im TikTok-Stil
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.