ActivityNet Entities 字幕数据集

本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)

ActivityNet-Entities 在 ActivityNet Captions 字幕数据集的基础上增加了 158k 边界框标注。每个标注都为一个名词短语。这些数据可用于训练视频描述模型。数据集演示了模型基于视频生成描述的有效性,也展示如何将图像描述应用于 Flickr30k 数据集上。