DoMSEV は、Dataset of Multimodal Semantic Egocentric Video の正式名で、個人のアクティビティに焦点を当てたマルチモーダル ビデオ データ セットです。 RGB-D データ、IMU データ、GPS データを合計 80 時間収録。ビデオには、レコーダー プロファイル、フレーム シーン、アクティビティ、インタラクション、注意などの注釈が付いています。このデータセットは、関連コンテンツを失わずにビデオをスムーズに早送りする問題を研究するために使用できます。