HyperAI
Command Palette
Search for a command to run...
OpenSAL360 全景视频显著性数据集
OpenSAL360 是目前最大规模的全方位视频显著性数据集,旨在支持视觉注意力、显著性预测以及多模态视频分析的研究,广泛应用于全景视频理解、视觉注意力建模、显著性预测算法评估、多模态感知研究以及 VR / AR 交互系统设计等多个研究与工程领域。 该数据集包含 500 段来自 YouTube 的多样化全景视频,平均时长 18.1 秒,所有视频流分辨率均为 3,840 x 1,920,由超过 2,000 名观察者完成数据标注,平均每段视频包含超过 84 组眼动注视点,同时完整保留了原始音频轨道。
数据结构
- videos:包含 500 个 mp4 全方位视频,30 FPS,带音频流
- saliency:500 个几乎无损压缩的显著性图视频
- fixations:500 个 JSON 文件,每帧包含注视点坐标,可用于生成显著性图
- metadata.json:记录每个视频的元信息,包括许可证、来源 URL 等
此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。