2 个月前

基于上下文的动作识别与R*CNN

Georgia Gkioxari; Ross Girshick; Jitendra Malik
基于上下文的动作识别与R*CNN
摘要

图像中存在多种线索可以揭示一个人正在进行的动作。例如,慢跑者的姿势具有典型的慢跑特征,但场景(如道路、小径)和其他慢跑者的存在也可以提供额外的信息来源。在本研究中,我们利用了动作伴随有上下文线索这一简单观察结果,构建了一个强大的动作识别系统。我们将RCNN进行了改进,使其在分类时可以使用多个区域,同时仍保留定位动作的能力。我们称该系统为RCNN。动作特定模型和特征图是联合训练的,这使得动作特定表示得以形成。RCNN在PASAL VOC动作数据集上达到了90.2%的平均AP值,显著优于该领域的其他所有方法。最后,我们展示了RCNN不仅限于动作识别任务。特别是,RCNN还可以用于解决细粒度任务,如属性分类。我们通过在Berkeley人物属性数据集上报告最先进性能来验证这一主张。

基于上下文的动作识别与R*CNN | 最新论文 | HyperAI超神经