6 个月前

计算机视觉

卷积神经网络

计算机视觉

Boyu Wang Huidong Liu Dimitris Samaras Minh Hoai

摘要

在人群计数任务中，每张训练图像包含多个个体，每个个体通过一个点进行标注。现有的人群计数方法通常需要使用高斯核对每个标注点进行平滑处理，或基于标注点估计每个像素的出现概率。本文表明，对标注点施加高斯平滑会损害模型的泛化性能。为此，我们提出了一种基于分布匹配的人群计数方法——DM-Count（Distribution Matching for Crowd Counting）。在DM-Count中，我们采用最优传输（Optimal Transport, OT）来衡量归一化预测密度图与归一化真实密度图之间的相似性。为稳定OT的计算过程，我们在模型中引入了总变差损失（Total Variation loss）。理论分析表明，DM-Count的泛化误差上界优于传统的高斯平滑方法。在平均绝对误差（Mean Absolute Error）指标上，DM-Count在两个大规模数据集UCF-QNRF和NWPU上显著优于此前的最先进方法，并在ShanghaiTech和UCF-CC50数据集上取得了当前最优的性能。相比已发表的最先进结果，DM-Count将误差降低了约16%。代码已开源，地址为：https://github.com/cvlab-stonybrook/DM-Count。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

卷积神经网络

计算机视觉

Boyu Wang Huidong Liu Dimitris Samaras Minh Hoai

摘要

在人群计数任务中，每张训练图像包含多个个体，每个个体通过一个点进行标注。现有的人群计数方法通常需要使用高斯核对每个标注点进行平滑处理，或基于标注点估计每个像素的出现概率。本文表明，对标注点施加高斯平滑会损害模型的泛化性能。为此，我们提出了一种基于分布匹配的人群计数方法——DM-Count（Distribution Matching for Crowd Counting）。在DM-Count中，我们采用最优传输（Optimal Transport, OT）来衡量归一化预测密度图与归一化真实密度图之间的相似性。为稳定OT的计算过程，我们在模型中引入了总变差损失（Total Variation loss）。理论分析表明，DM-Count的泛化误差上界优于传统的高斯平滑方法。在平均绝对误差（Mean Absolute Error）指标上，DM-Count在两个大规模数据集UCF-QNRF和NWPU上显著优于此前的最先进方法，并在ShanghaiTech和UCF-CC50数据集上取得了当前最优的性能。相比已发表的最先进结果，DM-Count将误差降低了约16%。代码已开源，地址为：https://github.com/cvlab-stonybrook/DM-Count。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供