HyperAIHyperAI

Command Palette

Search for a command to run...

缩放:用于伪装目标检测的多尺度三元组网络

Youwei Pang extsuperscript1 extsuperscript† Xiaoqi Zhao extsuperscript1 extsuperscript‡ Tian-Zhu Xiang extsuperscript3 Lihe Zhang extsuperscript1 extsuperscript* Huchuan Lu extsuperscript1,2

摘要

最近提出的伪装物体检测(COD)旨在分割在视觉上与其周围环境融合的物体,这在现实场景中极为复杂且困难。除了伪装物体与背景之间存在较高的固有相似性外,这些物体通常在尺度上具有多样性,外观模糊,甚至严重遮挡。为了解决这些问题,我们提出了一种混合尺度三元组网络——ZoomNet,该网络模拟了人类观察模糊图像时的行为,即放大和缩小。具体而言,我们的ZoomNet通过设计的尺度融合单元和层次混合尺度单元采用放大策略来学习区分性的混合尺度语义,从而充分探索候选物体与背景环境之间的不易察觉的线索。此外,考虑到不可区分纹理带来的不确定性和模糊性,我们构建了一个简单而有效的正则化约束——不确定性感知损失(uncertainty-aware loss),以促进模型在候选区域中更准确地生成高置信度的预测结果。无需复杂的附加功能,我们所提出的高度任务友好的模型在四个公开数据集上持续超越现有的23种最先进方法。此外,该模型在SOD任务上的表现优于近期的前沿模型,进一步验证了其有效性和通用性。代码将在\url{https://github.com/lartpang/ZoomNet}提供


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供