6 个月前

多任务学习

计算机视觉

Hughes Perreault Guillaume-Alexandre Bilodeau Nicolas Saunier Maguelonne Héritier

摘要

人类在搜索不同类型的物体时，能够非常有效地将视觉注意力集中在相关区域。例如，当我们寻找车辆时，会关注街道，而非建筑物顶部。本文的动机在于通过多任务学习的方法，训练神经网络实现类似的人类视觉注意力机制。为训练视觉注意力，我们采用半监督方式生成前景/背景分割标签，利用背景减除或光流技术实现。基于这些标签，我们训练一个目标检测模型，使其在共享大部分网络参数的同时，既能生成前景/背景分割图，也能输出边界框。我们将这些分割图作为网络内部的自注意力机制，用于加权生成边界框所用的特征图，从而抑制非相关区域的信号干扰。实验结果表明，该方法在两个交通监控数据集上均显著提升了平均精度（mAP），并在UA-DETRAC和UAVDT两个基准数据集上达到了当前最优水平。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

多任务学习

计算机视觉

Hughes Perreault Guillaume-Alexandre Bilodeau Nicolas Saunier Maguelonne Héritier

摘要

人类在搜索不同类型的物体时，能够非常有效地将视觉注意力集中在相关区域。例如，当我们寻找车辆时，会关注街道，而非建筑物顶部。本文的动机在于通过多任务学习的方法，训练神经网络实现类似的人类视觉注意力机制。为训练视觉注意力，我们采用半监督方式生成前景/背景分割标签，利用背景减除或光流技术实现。基于这些标签，我们训练一个目标检测模型，使其在共享大部分网络参数的同时，既能生成前景/背景分割图，也能输出边界框。我们将这些分割图作为网络内部的自注意力机制，用于加权生成边界框所用的特征图，从而抑制非相关区域的信号干扰。实验结果表明，该方法在两个交通监控数据集上均显著提升了平均精度（mAP），并在UA-DETRAC和UAVDT两个基准数据集上达到了当前最优水平。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供