Temporal Sentence Grounding
Temporal Sentence Grounding (TSG) 是计算机视觉领域的子任务,旨在通过给定的自然语言查询,在未剪辑的视频中定位特定时刻。该任务利用不同层次的监督信息,包括弱监督(视频级动作类别集)、半弱监督(视频级动作类别集及若干时间戳的动作标注)和全监督(未剪辑视频中所有动作的类别及时间区间标注),以提高定位精度和泛化能力。TSG 对于视频检索、内容理解和人机交互具有重要应用价值。
Temporal Sentence Grounding (TSG) 是计算机视觉领域的子任务,旨在通过给定的自然语言查询,在未剪辑的视频中定位特定时刻。该任务利用不同层次的监督信息,包括弱监督(视频级动作类别集)、半弱监督(视频级动作类别集及若干时间戳的动作标注)和全监督(未剪辑视频中所有动作的类别及时间区间标注),以提高定位精度和泛化能力。TSG 对于视频检索、内容理解和人机交互具有重要应用价值。