
摘要
在未剪辑视频中检测活动是一项重要但具有挑战性的任务。现有方法的性能仍不尽如人意,例如,它们在定位长时间复杂动作的起始点和结束点时经常遇到困难。本文提出了一种通用框架,能够从未剪辑视频中准确检测出多种活动。我们的第一个贡献是一种新颖的候选生成方案,可以高效地生成具有准确时间边界的候选片段。另一个贡献是一个级联分类管道,明确区分了候选实例的相关性和完整性。在两个具有挑战性的时间活动检测数据集THUMOS14和ActivityNet上,所提出的框架显著优于现有的最先进方法,展示了处理各种时间结构活动的优越准确性和强大适应性。