8 个月前

计算机视觉

计算机视觉

Junyi Zhang Charles Herrmann Junhwa Hur Luisa F. Polanía Varun Jampani Deqing Sun Ming-Hsuan Yang

摘要

文本到图像扩散模型在生成和编辑高质量图像方面取得了显著进展。因此，许多方法探索了扩散模型特征在理解和处理单个图像以完成下游任务（如分类、语义分割和风格化）的能力。然而，关于这些特征在多个不同图像和对象之间揭示的信息，人们了解得还远远不够。在这项工作中，我们利用 Stable Diffusion (SD) 特征进行语义和密集对应，并发现通过简单的后处理，SD 特征可以定量地与最先进的表示方法相媲美。有趣的是，定性分析显示 SD 特征与现有的表示学习特征（例如最近发布的 DINOv2）具有非常不同的属性：虽然 DINOv2 提供稀疏但准确的匹配，SD 特征则提供高质量的空间信息，但有时语义匹配不够准确。我们展示了这两种特征的简单融合效果出奇地好，并且使用这些融合特征进行零样本评估时，基于最近邻的方法在基准数据集（如 SPair-71k、PF-Pascal 和 TSS）上的性能显著优于现有最先进方法。此外，我们还证明了这些对应关系可以支持一些有趣的应用，例如两幅图像中的实例交换。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Junyi Zhang Charles Herrmann Junhwa Hur Luisa F. Polanía Varun Jampani Deqing Sun Ming-Hsuan Yang

摘要

文本到图像扩散模型在生成和编辑高质量图像方面取得了显著进展。因此，许多方法探索了扩散模型特征在理解和处理单个图像以完成下游任务（如分类、语义分割和风格化）的能力。然而，关于这些特征在多个不同图像和对象之间揭示的信息，人们了解得还远远不够。在这项工作中，我们利用 Stable Diffusion (SD) 特征进行语义和密集对应，并发现通过简单的后处理，SD 特征可以定量地与最先进的表示方法相媲美。有趣的是，定性分析显示 SD 特征与现有的表示学习特征（例如最近发布的 DINOv2）具有非常不同的属性：虽然 DINOv2 提供稀疏但准确的匹配，SD 特征则提供高质量的空间信息，但有时语义匹配不够准确。我们展示了这两种特征的简单融合效果出奇地好，并且使用这些融合特征进行零样本评估时，基于最近邻的方法在基准数据集（如 SPair-71k、PF-Pascal 和 TSS）上的性能显著优于现有最先进方法。此外，我们还证明了这些对应关系可以支持一些有趣的应用，例如两幅图像中的实例交换。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供