HyperAIHyperAI

Command Palette

Search for a command to run...

基于上下文的动作识别与R*CNN

Georgia Gkioxari Ross Girshick Jitendra Malik

摘要

图像中存在多种线索可以揭示一个人正在进行的动作。例如,慢跑者的姿势具有典型的慢跑特征,但场景(如道路、小径)和其他慢跑者的存在也可以提供额外的信息来源。在本研究中,我们利用了动作伴随有上下文线索这一简单观察结果,构建了一个强大的动作识别系统。我们将RCNN进行了改进,使其在分类时可以使用多个区域,同时仍保留定位动作的能力。我们称该系统为RCNN。动作特定模型和特征图是联合训练的,这使得动作特定表示得以形成。RCNN在PASAL VOC动作数据集上达到了90.2%的平均AP值,显著优于该领域的其他所有方法。最后,我们展示了RCNN不仅限于动作识别任务。特别是,RCNN还可以用于解决细粒度任务,如属性分类。我们通过在Berkeley人物属性数据集上报告最先进性能来验证这一主张。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供