HyperAI
Command Palette
Search for a command to run...
视频叙事定位
Video Narrative Grounding 是连接视觉与语言的任务,旨在将视频叙述与特定视频片段关联。该任务以包含文本描述的视频及其中标记的名词位置为输入,要求对每个标记名词在每一帧中对应的目标对象生成分割掩码。通过精准定位视频中的物体,Video Narrative Grounding 在多模态理解、视频标注和内容检索等领域具有重要应用价值。
暂无数据
该任务下暂无可用的基准测试数据