HyperAIHyperAI

Command Palette

Search for a command to run...

重新思考Faster R-CNN架构在时间动作定位中的应用

Yu-Wei Chao; Sudheendra Vijayanarasimhan; Bryan Seybold; David A. Ross; Jia Deng; Rahul Sukthankar

摘要

我们提出了TAL-Net,这是一种受Faster R-CNN目标检测框架启发的视频时序动作定位改进方法。TAL-Net解决了现有方法中的三个关键问题:(1)通过多尺度架构改善感受野对齐,以适应动作持续时间的极端变化;(2)通过适当扩展感受野,更好地利用动作的时间上下文进行候选区域生成和动作分类;(3)明确考虑多流特征融合,并证明了后期融合运动特征的重要性。我们在THUMOS'14检测基准上实现了最先进的动作候选区域生成和定位性能,并在ActivityNet挑战赛中取得了具有竞争力的成绩。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供