HyperAIHyperAI

Command Palette

Search for a command to run...

拥挤场景中的目标检测:一个提议,多重预测

Xuangeng Chu Anlin Zheng Xiangyu Zhang Jian Sun

摘要

我们提出了一种简单而有效的基于提议(proposal-based)的物体检测器,旨在检测密集场景中高度重叠的物体实例。本方法的核心思想是:让每个提议(proposal)预测一组相关联的物体实例,而非传统基于提议的框架中仅预测单一实例。通过引入EMD损失(EMD Loss)和集合非极大值抑制(Set NMS)等新策略,我们的检测器能够有效应对高度重叠物体检测的挑战。在FPN-Res50基线模型上,该方法在具有挑战性的CrowdHuman数据集上实现了4.9%的AP提升,在CityPersons数据集上实现了1.0%的MR2\text{MR}^{-2}MR2性能改进,且无需任何额外的复杂技巧(bells and whistles)。此外,在相对稀疏的COCO等数据集上,该方法仍能取得可观的性能提升,表明所提出方法对场景拥挤程度具有良好的鲁棒性。代码与预训练模型将开源发布于:https://github.com/megvii-model/CrowdDetection


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供