8 个月前

多任务学习

计算机视觉

计算机视觉

Dantong Niu†‡ Xudong Wang†‡ Xinyang Han* Long Lian Roei Herzig Trevor Darrell

摘要

已提出多种无需密集手动标注分割掩模的无监督图像分割方法；当前模型分别处理语义分割（例如，STEGO）或类别无关实例分割（例如，CutLER），但不能同时处理两者（即全景分割）。我们提出了一种无监督通用分割模型（U2Seg），该模型通过新颖的统一框架能够执行各种图像分割任务——实例分割、语义分割和全景分割。U2Seg利用自监督模型生成这些分割任务的伪语义标签，随后进行聚类；每个聚类代表像素的不同语义和/或实例归属。然后，我们在这些伪语义标签上对模型进行自我训练，从而在针对每项任务专门设计的方法中获得显著的性能提升：在COCO数据集上的无监督实例分割中比CutLER提高了+2.6 AP(^{\text{box}})，在COCOStuff数据集上的无监督语义分割中比STEGO提高了+7.0像素准确率。此外，我们的方法为无监督全景分割建立了一个新的基准，而这一领域此前尚未被探索。U2Seg还是少样本分割的强大预训练模型，在低数据量条件下训练时表现优于CutLER，例如仅使用1%的COCO标签时，其AP(^{\text{mask}})指标高出+5.0。我们希望这一简单而有效的方法能够激发更多关于无监督通用图像分割的研究。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

多任务学习

计算机视觉

计算机视觉

Dantong Niu†‡ Xudong Wang†‡ Xinyang Han* Long Lian Roei Herzig Trevor Darrell

摘要

已提出多种无需密集手动标注分割掩模的无监督图像分割方法；当前模型分别处理语义分割（例如，STEGO）或类别无关实例分割（例如，CutLER），但不能同时处理两者（即全景分割）。我们提出了一种无监督通用分割模型（U2Seg），该模型通过新颖的统一框架能够执行各种图像分割任务——实例分割、语义分割和全景分割。U2Seg利用自监督模型生成这些分割任务的伪语义标签，随后进行聚类；每个聚类代表像素的不同语义和/或实例归属。然后，我们在这些伪语义标签上对模型进行自我训练，从而在针对每项任务专门设计的方法中获得显著的性能提升：在COCO数据集上的无监督实例分割中比CutLER提高了+2.6 AP(^{\text{box}})，在COCOStuff数据集上的无监督语义分割中比STEGO提高了+7.0像素准确率。此外，我们的方法为无监督全景分割建立了一个新的基准，而这一领域此前尚未被探索。U2Seg还是少样本分割的强大预训练模型，在低数据量条件下训练时表现优于CutLER，例如仅使用1%的COCO标签时，其AP(^{\text{mask}})指标高出+5.0。我们希望这一简单而有效的方法能够激发更多关于无监督通用图像分割的研究。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

无监督通用图像分割 | 论文 | HyperAI超神经