6 个月前

卷积神经网络

计算机视觉

Kyle Min Jason J. Corso

摘要

近年来，对未剪辑视频中活动的时间定位问题已受到广泛关注。尽管取得了诸多进展，现有的弱监督时间活动定位方法在识别活动未发生的情况方面仍存在困难。为解决这一问题，本文提出了一种名为A2CL-PT的新方法。该方法在特征空间中引入了两组三元组：其中一组用于学习每类活动的判别性特征，另一组则用于区分视频中无活动发生时的背景特征与与活动相关的特征。为进一步提升性能，我们设计了一个由两个并行分支组成的网络结构，二者以对抗方式协同工作：第一个分支负责定位视频中最显著的活动片段，第二个分支则从未被定位的部分中挖掘其他补充性活动。在THUMOS14和ActivityNet数据集上的大量实验结果表明，所提方法具有显著有效性。具体而言，在THUMOS14数据集上，IoU阈值从0.1到0.9的平均mAP指标由27.9%显著提升至30.0%。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Kyle Min Jason J. Corso

摘要

近年来，对未剪辑视频中活动的时间定位问题已受到广泛关注。尽管取得了诸多进展，现有的弱监督时间活动定位方法在识别活动未发生的情况方面仍存在困难。为解决这一问题，本文提出了一种名为A2CL-PT的新方法。该方法在特征空间中引入了两组三元组：其中一组用于学习每类活动的判别性特征，另一组则用于区分视频中无活动发生时的背景特征与与活动相关的特征。为进一步提升性能，我们设计了一个由两个并行分支组成的网络结构，二者以对抗方式协同工作：第一个分支负责定位视频中最显著的活动片段，第二个分支则从未被定位的部分中挖掘其他补充性活动。在THUMOS14和ActivityNet数据集上的大量实验结果表明，所提方法具有显著有效性。具体而言，在THUMOS14数据集上，IoU阈值从0.1到0.9的平均mAP指标由27.9%显著提升至30.0%。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供