Command Palette
Search for a command to run...
Benchmark-Datensatz Für DREAM-1K-Videobeschreibungen
DREAM-1K ist ein von ByteDance veröffentlichter Benchmark-Datensatz für Videobeschreibungen. Die zugehörigen Ergebnisse sind:Tarsier: Rezepte zum Trainieren und Auswerten großer Videobeschreibungsmodelle".
Der Datensatz enthält 1.000 kommentierte Videoclips (ca. 10 Sekunden lang) unterschiedlicher Komplexität aus fünf verschiedenen Kategorien. Jeder Clip enthält mindestens ein dynamisches Ereignis, das anhand eines einzelnen Frames nicht eindeutig identifiziert werden kann. Jedes Video ist mit detaillierten manuellen Anmerkungen versehen, die alle Ereignisse, Aktionen und Bewegungen abdecken.
Datenquellenkategorie:
- Realfilme
- Animationsfilme
- Stockvideo
- Lange YouTube-Videos
- Kurzvideos im TikTok-Stil
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.