
摘要
本文关注的是部分视频拷贝检测性能的评估。目前已有若干公开数据集是基于网络视频构建的。由于视频拷贝检测问题本质上源于连续的视频广播,因此,采用电视(TV)数据集进行处理成为一种更具优势的替代方案,其能够提供更高的可扩展性,并对退化因素进行有效控制,从而实现更精细的性能评估。本文提出一个名为STVD的电视视频数据集。该数据集基于一套协议设计,确保了视频采集的可扩展性以及高质量的标注真实性(robust groundtruthing)。STVD是当前该任务中规模最大的公开数据集,包含近83,000个视频,总时长达10,660小时。本文还报告了代表性方法在该数据集上的性能评估结果,为后续研究提供了基准比较依据。