VidSTG 大規模ビデオ グラウンディング データセット

VidSTG データセットは、VidOR データセット上に構築された時空間ビデオ グラウンディング データセットです。 VidOR は、トレーニング、検証、テスト用にそれぞれ 7,000、835、2,165 のビデオを含むビデオ リレーショナル データセットです。時空間ビデオ グラウンディング タスクの目標は、ターゲットを説明する特定の文に一致するノーカット ビデオの時空間部分を特定することです。
VidSTG データセットは、VidOR データセット上に構築された時空間ビデオ グラウンディング データセットです。 VidOR は、トレーニング、検証、テスト用にそれぞれ 7,000、835、2,165 のビデオを含むビデオ リレーショナル データセットです。時空間ビデオ グラウンディング タスクの目標は、ターゲットを説明する特定の文に一致するノーカット ビデオの時空間部分を特定することです。