7 个月前

卷积神经网络

计算机视觉

Georgia Gkioxari Ross Girshick Jitendra Malik

摘要

图像中存在多种线索可以揭示一个人正在进行的动作。例如，慢跑者的姿势具有典型的慢跑特征，但场景（如道路、小径）和其他慢跑者的存在也可以提供额外的信息来源。在本研究中，我们利用了动作伴随有上下文线索这一简单观察结果，构建了一个强大的动作识别系统。我们将RCNN进行了改进，使其在分类时可以使用多个区域，同时仍保留定位动作的能力。我们称该系统为RCNN。动作特定模型和特征图是联合训练的，这使得动作特定表示得以形成。RCNN在PASAL VOC动作数据集上达到了90.2%的平均AP值，显著优于该领域的其他所有方法。最后，我们展示了RCNN不仅限于动作识别任务。特别是，RCNN还可以用于解决细粒度任务，如属性分类。我们通过在Berkeley人物属性数据集上报告最先进性能来验证这一主张。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

计算机视觉

Georgia Gkioxari Ross Girshick Jitendra Malik

摘要

图像中存在多种线索可以揭示一个人正在进行的动作。例如，慢跑者的姿势具有典型的慢跑特征，但场景（如道路、小径）和其他慢跑者的存在也可以提供额外的信息来源。在本研究中，我们利用了动作伴随有上下文线索这一简单观察结果，构建了一个强大的动作识别系统。我们将RCNN进行了改进，使其在分类时可以使用多个区域，同时仍保留定位动作的能力。我们称该系统为RCNN。动作特定模型和特征图是联合训练的，这使得动作特定表示得以形成。RCNN在PASAL VOC动作数据集上达到了90.2%的平均AP值，显著优于该领域的其他所有方法。最后，我们展示了RCNN不仅限于动作识别任务。特别是，RCNN还可以用于解决细粒度任务，如属性分类。我们通过在Berkeley人物属性数据集上报告最先进性能来验证这一主张。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供