6 个月前

计算机视觉

多任务学习

计算机视觉

Jie Qin Peng Zheng Yichao Yan Rong Quan Xiaogang Cheng Bingbing Ni

摘要

行人搜索旨在从自然场景的非裁剪图像中联合定位并识别查询行人，近年来受到广泛关注。本文深入挖掘目标行人周围丰富的全局与局部上下文信息，分别称之为场景上下文与群体上下文。与以往将两类上下文分别处理的方法不同，本文提出一种统一的全局-局部上下文网络（GLCNet），旨在通过协同利用两类上下文实现特征增强。具体而言，该网络采用多阶段联合学习策略，同步优化行人重识别（re-ID）嵌入特征与上下文特征，从而获得更具判别性的增强特征表示。我们在两个主流行人搜索基准数据集（CUHK-SYSU 和 PRW）上进行了实验，并将该方法拓展至更具挑战性的场景——MovieNet 数据集上的角色搜索任务。大量实验结果表明，所提出的 GLCNet 在三个数据集上均显著优于现有最先进方法。相关源代码、预训练模型及新构建的数据集已公开发布于：https://github.com/ZhengPeng7/GLCNet。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

多任务学习

计算机视觉

Jie Qin Peng Zheng Yichao Yan Rong Quan Xiaogang Cheng Bingbing Ni

摘要

行人搜索旨在从自然场景的非裁剪图像中联合定位并识别查询行人，近年来受到广泛关注。本文深入挖掘目标行人周围丰富的全局与局部上下文信息，分别称之为场景上下文与群体上下文。与以往将两类上下文分别处理的方法不同，本文提出一种统一的全局-局部上下文网络（GLCNet），旨在通过协同利用两类上下文实现特征增强。具体而言，该网络采用多阶段联合学习策略，同步优化行人重识别（re-ID）嵌入特征与上下文特征，从而获得更具判别性的增强特征表示。我们在两个主流行人搜索基准数据集（CUHK-SYSU 和 PRW）上进行了实验，并将该方法拓展至更具挑战性的场景——MovieNet 数据集上的角色搜索任务。大量实验结果表明，所提出的 GLCNet 在三个数据集上均显著优于现有最先进方法。相关源代码、预训练模型及新构建的数据集已公开发布于：https://github.com/ZhengPeng7/GLCNet。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供