2 个月前

重新思考Faster R-CNN架构在时间动作定位中的应用

Yu-Wei Chao; Sudheendra Vijayanarasimhan; Bryan Seybold; David A. Ross; Jia Deng; Rahul Sukthankar
重新思考Faster R-CNN架构在时间动作定位中的应用
摘要

我们提出了TAL-Net,这是一种受Faster R-CNN目标检测框架启发的视频时序动作定位改进方法。TAL-Net解决了现有方法中的三个关键问题:(1)通过多尺度架构改善感受野对齐,以适应动作持续时间的极端变化;(2)通过适当扩展感受野,更好地利用动作的时间上下文进行候选区域生成和动作分类;(3)明确考虑多流特征融合,并证明了后期融合运动特征的重要性。我们在THUMOS'14检测基准上实现了最先进的动作候选区域生成和定位性能,并在ActivityNet挑战赛中取得了具有竞争力的成绩。

重新思考Faster R-CNN架构在时间动作定位中的应用 | 最新论文 | HyperAI超神经