6 个月前

计算机视觉

Perla Doubinsky Nicolas Audebert Michel Crucianu Hervé Le Borgne

摘要

随着强大文本到图像扩散模型的出现，近期研究探索了利用合成数据以提升图像分类性能的可行性。这些研究证实，合成数据能够有效扩充甚至替代真实数据。在本工作中，我们探讨了合成数据在少样本、类别无关计数任务中的潜在优势。该任务要求生成与给定物体数量相对应的图像。然而，现有的文本到图像模型难以准确理解“数量”这一概念。为此，我们提出采用双重条件控制的Stable Diffusion模型，即同时结合文本提示（prompt）与密度图（density map），以增强少样本计数任务的训练数据集。由于训练数据集规模较小，微调后的模型倾向于生成与训练图像高度相似的样本。为提升合成图像的多样性，我们进一步提出在不同图像之间交换文本描述，从而生成未曾见过的物体类型组合与空间布局配置。实验结果表明，所提出的多样化生成策略显著提升了两种近期表现优异的少样本计数模型在FSC147与CARPK数据集上的计数准确率。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

Perla Doubinsky Nicolas Audebert Michel Crucianu Hervé Le Borgne

摘要

随着强大文本到图像扩散模型的出现，近期研究探索了利用合成数据以提升图像分类性能的可行性。这些研究证实，合成数据能够有效扩充甚至替代真实数据。在本工作中，我们探讨了合成数据在少样本、类别无关计数任务中的潜在优势。该任务要求生成与给定物体数量相对应的图像。然而，现有的文本到图像模型难以准确理解“数量”这一概念。为此，我们提出采用双重条件控制的Stable Diffusion模型，即同时结合文本提示（prompt）与密度图（density map），以增强少样本计数任务的训练数据集。由于训练数据集规模较小，微调后的模型倾向于生成与训练图像高度相似的样本。为提升合成图像的多样性，我们进一步提出在不同图像之间交换文本描述，从而生成未曾见过的物体类型组合与空间布局配置。实验结果表明，所提出的多样化生成策略显著提升了两种近期表现优异的少样本计数模型在FSC147与CARPK数据集上的计数准确率。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供