
摘要
我们提出了一项关于新型任务——伪装目标检测(Camouflaged Object Detection, COD)的全面研究。该任务旨在识别那些“无缝融入”周围环境中的物体。由于目标物体与背景之间存在极高的内在相似性,COD相较于传统的目标检测任务更具挑战性。为应对这一难题,我们精心构建了一个全新的数据集,命名为COD10K,包含10,000张图像,涵盖多种自然场景下的伪装物体,涉及超过78个物体类别。所有图像均进行了密集标注,包含类别标签、边界框、对象级/实例级标签以及抠图级(matting-level)标签。该数据集有望成为推动多项视觉任务(如定位、分割和Alpha抠图等)发展的催化剂。此外,我们提出了一种简单但高效的COD框架,称为搜索识别网络(Search Identification Network, SINet)。该框架不依赖任何复杂组件,在所有测试数据集上均显著优于多种先进的目标检测基准模型,展现出强大的鲁棒性与通用性,可为未来COD领域的研究提供有力支持。最后,我们开展了一项大规模的COD研究,系统评估了13种前沿模型,揭示了一些有趣的发现,并展示了若干潜在应用场景。本研究为学术界提供了一个探索这一新兴领域的宝贵契机。相关代码已开源,可访问 https://github.com/DengPingFan/SINet/ 获取。