11 天前

对齐与蒸馏:统一与提升领域自适应目标检测

Justin Kay, Timm Haucke, Suzanne Stathatos, Siqi Deng, Erik Young, Pietro Perona, Sara Beery, Grant Van Horn
对齐与蒸馏:统一与提升领域自适应目标检测
摘要

目标检测模型在与训练数据分布不同的测试数据上通常表现不佳。近年来,领域自适应目标检测(Domain Adaptive Object Detection, DAOD)方法在应对这一挑战方面取得了显著进展。然而,我们发现当前评估体系中存在系统性缺陷,这些缺陷不仅使以往的研究成果值得重新审视,也严重制约了该领域的进一步发展:(a)由于基线方法能力不足,导致性能评估结果被高估;(b)实现方式不一致,阻碍了不同方法之间的透明、公平比较;(c)评估基准缺乏通用性,主要源于使用过时的主干网络架构,以及基准数据集多样性不足。为解决上述问题,我们提出了以下四项核心贡献:(1)构建了一个统一的基准测试与实现框架——对齐与蒸馏(Align and Distill, ALDI),支持DAOD方法的标准化比较,并为未来研究提供可扩展的开发基础;(2)设计了一套公平且现代化的训练与评估协议,有效规避现有基准测试中的各类陷阱;(3)推出一个新的DAOD基准数据集——CFC-DAOD,支持在多样化的真实世界场景下进行模型评估;(4)提出一种新方法ALDI++,在多个任务上实现了显著超越现有技术水平的性能提升。具体而言,ALDI++在Cityscapes到Foggy Cityscapes的跨域检测任务中,相比先前最先进方法提升了+3.5 AP50;在Sim10k到Cityscapes的迁移任务中,提升达+5.7 AP50(我们的方法是唯一在公平基线之上取得提升的方法);在CFC Kenai到Channel的水域鱼类计数任务中,也实现了+0.6 AP50的提升。ALDI与ALDI++具有架构无关性(architecture-agnostic),无需额外超参数调优,即可在基于YOLO和DETR的DAOD框架中达到新的最先进水平。本研究提出的框架、数据集及先进方法,为DAOD领域提供了一次关键性的“重置”(reset),奠定了未来研究的坚实基础。相关代码与数据已公开:https://github.com/justinkay/aldi 和 https://github.com/visipedia/caltech-fish-counting。