Command Palette
Search for a command to run...
OpenSAL360パノラマビデオ顕著性データセット
OpenSAL360は、視覚的注意、顕著性予測、マルチモーダルビデオ分析の研究を支援するために設計された、現在最大規模の包括的なビデオ顕著性データセットです。パノラマビデオの理解、視覚的注意モデリング、顕著性予測アルゴリズムの評価、マルチモーダル知覚研究、VR/ARインタラクティブシステム設計など、さまざまな研究および工学分野で広く利用されています。 このデータセットには、YouTubeから収集した500本の多様なパノラマ動画が含まれており、平均再生時間は18.1秒です。すべての動画ストリームの解像度は3,840 x 1,920です。データは2,000人以上の観察者によって注釈が付けられており、各動画には平均84回以上の視線追跡データが記録されています。また、元の音声トラックは完全に保存されています。
データ構造
- 動画:500本のMP4動画(フルレンジ、30fps、音声ストリーミング付き)を収録。
- 顕著性:ほぼロスレス圧縮された顕著性マップ500枚(動画)
- 視線固定データ:500個のJSONファイル。各ファイルには視線座標が含まれており、顕著性マップの生成に使用できます。
- metadata.json: 各動画のメタデータ情報(ライセンス、ソースURLなど)を記録します。