VidSTG 大規模ビデオ グラウンディング データセット

下载帮助
特色图像

VidSTG データセットは、VidOR データセット上に構築された時空間ビデオ グラウンディング データセットです。 VidOR は、トレーニング、検証、テスト用にそれぞれ 7,000、835、2,165 のビデオを含むビデオ リレーショナル データセットです。時空間ビデオ グラウンディング タスクの目標は、ターゲットを説明する特定の文に一致するノーカット ビデオの時空間部分を特定することです。