6 个月前

计算机视觉

Hughes Perreault Guillaume-Alexandre Bilodeau Nicolas Saunier Maguelonne Héritier

摘要

视频中连续帧之间存在大量冗余信息。现有的目标检测器通常逐帧处理图像，无法利用这种帧间相似性。然而，许多目标检测的应用场景实际处理的是视频数据，例如智能交通系统、高级驾驶辅助系统以及视频监控等。本文旨在利用视频帧之间的相似性，以提升目标检测的性能。为此，我们提出了一种名为FFAVOD（Feature Fusion Architecture for Video Object Detection）的新型视频目标检测架构。首先，我们设计了一种新颖的视频目标检测框架，使网络能够在相邻帧之间共享特征图。其次，我们提出了一种特征融合模块，该模块能够学习如何有效融合多个特征图，从而增强特征表达能力。实验结果表明，所提出的架构与融合模块可显著提升三种基础目标检测器在两个包含移动道路使用者序列的数据集上的检测性能。为进一步提升检测效果，我们还对SpotNet注意力模块进行了优化改进。将FFAVOD架构应用于改进后的SpotNet检测器，在UA-DETRAC公开基准数据集和UAVDT数据集上均取得了当前最优（state-of-the-art）的检测性能。相关代码已开源，地址为：https://github.com/hu64/FFAVOD。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

Hughes Perreault Guillaume-Alexandre Bilodeau Nicolas Saunier Maguelonne Héritier

摘要

视频中连续帧之间存在大量冗余信息。现有的目标检测器通常逐帧处理图像，无法利用这种帧间相似性。然而，许多目标检测的应用场景实际处理的是视频数据，例如智能交通系统、高级驾驶辅助系统以及视频监控等。本文旨在利用视频帧之间的相似性，以提升目标检测的性能。为此，我们提出了一种名为FFAVOD（Feature Fusion Architecture for Video Object Detection）的新型视频目标检测架构。首先，我们设计了一种新颖的视频目标检测框架，使网络能够在相邻帧之间共享特征图。其次，我们提出了一种特征融合模块，该模块能够学习如何有效融合多个特征图，从而增强特征表达能力。实验结果表明，所提出的架构与融合模块可显著提升三种基础目标检测器在两个包含移动道路使用者序列的数据集上的检测性能。为进一步提升检测效果，我们还对SpotNet注意力模块进行了优化改进。将FFAVOD架构应用于改进后的SpotNet检测器，在UA-DETRAC公开基准数据集和UAVDT数据集上均取得了当前最优（state-of-the-art）的检测性能。相关代码已开源，地址为：https://github.com/hu64/FFAVOD。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

FFAVOD：用于视频目标检测的特征融合架构 | 论文 | HyperAI超神经