6 个月前

计算机视觉

卷积神经网络

计算机视觉

Hai-Ming Xu Lingqiao Liu Qiuchen Bian Zhen Yang

摘要

半监督语义分割要求模型能够有效地将少量标注图像中的标签信息传播至大量未标注图像中。此类像素级预测任务面临的一个关键挑战是类内差异较大，即同一类别内的区域在图像中可能呈现出截然不同的外观特征。这种多样性使得标签从像素到像素的传播变得极为困难。为解决这一问题，我们提出一种新方法，通过规范化类内特征的分布来缓解标签传播的难度。具体而言，该方法促使线性预测器的输出与基于原型的预测器输出保持一致性，从而隐式地促使同一伪类别下的特征靠近至少一个类内原型，同时远离其他类别的原型。在此基础上，进一步引入CutMix数据增强策略以及一种精心设计的原型维护机制，我们构建了一种半监督语义分割算法。在Pascal VOC与Cityscapes两个基准数据集上的大量实验评估表明，该方法在性能上显著优于现有最先进方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

卷积神经网络

计算机视觉

Hai-Ming Xu Lingqiao Liu Qiuchen Bian Zhen Yang

摘要

半监督语义分割要求模型能够有效地将少量标注图像中的标签信息传播至大量未标注图像中。此类像素级预测任务面临的一个关键挑战是类内差异较大，即同一类别内的区域在图像中可能呈现出截然不同的外观特征。这种多样性使得标签从像素到像素的传播变得极为困难。为解决这一问题，我们提出一种新方法，通过规范化类内特征的分布来缓解标签传播的难度。具体而言，该方法促使线性预测器的输出与基于原型的预测器输出保持一致性，从而隐式地促使同一伪类别下的特征靠近至少一个类内原型，同时远离其他类别的原型。在此基础上，进一步引入CutMix数据增强策略以及一种精心设计的原型维护机制，我们构建了一种半监督语义分割算法。在Pascal VOC与Cityscapes两个基准数据集上的大量实验评估表明，该方法在性能上显著优于现有最先进方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供