11 天前
多任务AET联合正交切线正则化用于暗目标检测
Ziteng Cui, Guo-Jun Qi, Lin Gu, Shaodi You, Zenghui Zhang, Tatsuya Harada

摘要
暗光环境由于光子数量不足及噪声干扰,给计算机视觉算法带来了严峻挑战。为提升暗光条件下的目标检测性能,本文提出一种新型多任务自编码变换模型(Multitask Auto Encoding Transformation, MAET),该模型能够挖掘光照变化背后的内在规律。在自监督学习框架下,MAET通过编码与解码真实世界的光照退化过程,结合物理噪声模型与图像信号处理(ISP)流程,学习图像的内在视觉结构。基于该表征,模型通过解码边界框坐标与类别信息完成目标检测任务。为避免任务间特征过度耦合,MAET通过引入正交切线正则性(orthogonal tangent regularity),实现目标特征与退化特征的有效解耦。这一机制构建了一个参数化流形,使得多任务预测可通过最大化各任务输出路径上切线方向之间的正交性,以几何方式形式化表达。本框架可基于主流目标检测架构实现,并可直接使用标准目标检测数据集(如VOC、COCO)进行端到端的联合训练。实验结果表明,该方法在合成数据集与真实世界数据集上均取得了当前最优的性能表现。相关代码已开源,地址为:https://github.com/cuiziteng/MAET。