HyperAI

Video Narrative Grounding 是连接视觉与语言的任务，旨在将视频叙述与特定视频片段关联。该任务以包含文本描述的视频及其中标记的名词位置为输入，要求对每个标记名词在每一帧中对应的目标对象生成分割掩码。通过精准定位视频中的物体，Video Narrative Grounding 在多模态理解、视频标注和内容检索等领域具有重要应用价值。

暂无数据

该任务下暂无可用的基准测试数据

HyperAI

暂无数据

该任务下暂无可用的基准测试数据

Command Palette

视频叙事定位

Command Palette

视频叙事定位

Command Palette

视频叙事定位