2 个月前

D-FINE:将DETRs中的回归任务重新定义为细粒度分布优化

Yansong Peng; Hebei Li; Peixi Wu; Yueyi Zhang; Xiaoyan Sun; Feng Wu
D-FINE:将DETRs中的回归任务重新定义为细粒度分布优化
摘要

我们介绍了一种强大的实时目标检测器D-FINE,该检测器通过在DETR模型中重新定义边界框回归任务,实现了卓越的定位精度。D-FINE包含两个关键组件:细粒度分布精炼(Fine-grained Distribution Refinement, FDR)和全局最优定位自蒸馏(Global Optimal Localization Self-Distillation, GO-LSD)。FDR将回归过程从预测固定坐标转变为迭代精炼概率分布,提供了细粒度的中间表示,显著提高了定位准确性。GO-LSD是一种双向优化策略,通过自蒸馏将定位知识从精炼分布传递到浅层,同时简化了深层的残差预测任务。此外,D-FINE在计算密集型模块和操作中引入了轻量级优化,实现了速度与准确性的更好平衡。具体而言,D-FINE-L / X在NVIDIA T4 GPU上分别以124 / 78 FPS的速度在COCO数据集上达到了54.0% / 55.8%的AP值。当在Objects365数据集上预训练时,D-FINE-L / X分别达到了57.1% / 59.3%的AP值,超越了所有现有的实时检测器。此外,我们的方法在几乎不增加额外参数和训练成本的情况下,显著提升了多种DETR模型的性能,最高可达5.3%的AP值提升。我们的代码和预训练模型可在以下链接获取:https://github.com/Peterande/D-FINE。

D-FINE:将DETRs中的回归任务重新定义为细粒度分布优化 | 最新论文 | HyperAI超神经