8 个月前

计算机视觉

Shuang Hao; Chunlin Zhong; He Tang

摘要

深度/热信息对于检测传统RGB图像中的显著对象非常有益。然而，在双模态显著对象检测（SOD）模型中，对噪声输入和模态缺失的鲁棒性至关重要，但相关研究却很少。为了解决这一问题，我们引入了一种包含两个核心组件的条件丢弃与语言驱动（CoLA）框架。1) 语言驱动质量评估（LQA）：利用预训练的视觉-语言模型和提示学习器，LQA在不需要额外质量注释的情况下重新校准图像贡献度。这种方法有效地减轻了噪声输入的影响。2) 条件丢弃（CD）：一种学习方法，旨在增强模型在模态缺失情况下的适应能力，同时保持其在模态完整情况下的性能。CD作为一种插件式训练方案，将模态缺失视为条件，从而增强了各种双模态SOD模型的整体鲁棒性。大量实验表明，所提出的方法在模态完整和模态缺失条件下均优于现有的最先进的双模态SOD模型。我们将在论文被接受后发布源代码。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

Shuang Hao; Chunlin Zhong; He Tang

摘要

深度/热信息对于检测传统RGB图像中的显著对象非常有益。然而，在双模态显著对象检测（SOD）模型中，对噪声输入和模态缺失的鲁棒性至关重要，但相关研究却很少。为了解决这一问题，我们引入了一种包含两个核心组件的条件丢弃与语言驱动（CoLA）框架。1) 语言驱动质量评估（LQA）：利用预训练的视觉-语言模型和提示学习器，LQA在不需要额外质量注释的情况下重新校准图像贡献度。这种方法有效地减轻了噪声输入的影响。2) 条件丢弃（CD）：一种学习方法，旨在增强模型在模态缺失情况下的适应能力，同时保持其在模态完整情况下的性能。CD作为一种插件式训练方案，将模态缺失视为条件，从而增强了各种双模态SOD模型的整体鲁棒性。大量实验表明，所提出的方法在模态完整和模态缺失条件下均优于现有的最先进的双模态SOD模型。我们将在论文被接受后发布源代码。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供