Command Palette
Search for a command to run...
OpenSAL360 Panorama-Video-Saliency-Datensatz
OpenSAL360 ist derzeit der größte umfassende Datensatz zur Video-Saliency und wurde zur Unterstützung der Forschung in den Bereichen visuelle Aufmerksamkeit, Saliency-Vorhersage und multimodale Videoanalyse entwickelt. Er findet breite Anwendung in verschiedenen Forschungs- und Entwicklungsfeldern, wie beispielsweise dem Verständnis von Panoramavideos, der Modellierung visueller Aufmerksamkeit, der Evaluierung von Saliency-Vorhersagealgorithmen, der multimodalen Wahrnehmungsforschung und dem Design interaktiver VR/AR-Systeme. Dieser Datensatz umfasst 500 verschiedene Panoramavideos von YouTube mit einer durchschnittlichen Dauer von 18,1 Sekunden. Alle Videostreams haben eine Auflösung von 3840 x 1920 Pixeln. Die Daten wurden von über 2000 Beobachtern annotiert, und jedes Video enthält durchschnittlich mehr als 84 Blickfixationen (Eye-Tracking). Die Original-Tonspuren sind vollständig erhalten.
Datenstruktur
- Videos: Enthält 500 MP4-Videos, voller Dynamikumfang, 30 FPS, mit Audio-Streaming.
- Auffälligkeit: 500 nahezu verlustfreie komprimierte Auffälligkeitskarten (Video)
- Fixationen: 500 JSON-Dateien, die jeweils Blickkoordinaten enthalten, aus denen Saliency-Maps generiert werden können.
- metadata.json: Speichert Metadateninformationen für jedes Video, einschließlich Lizenz, Quell-URL usw.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.