17 天前
Group DETR v2:基于编码器-解码器预训练的强性能目标检测器
Qiang Chen, Jian Wang, Chuchu Han, Shan Zhang, Zexian Li, Xiaokang Chen, Jiahui Chen, Xiaodi Wang, Shuming Han, Gang Zhang, Haocheng Feng, Kun Yao, Junyu Han, Errui Ding, Jingdong Wang

摘要
我们提出了一种基于编码器-解码器预训练与微调策略的强效目标检测方法。该方法名为 Group DETR v2,其架构基于视觉Transformer编码器 ViT-Huge~\cite{dosovitskiy2020image}、DETR 变体 DINO~\cite{zhang2022dino},以及一种高效的 DETR 训练方法 Group DETR~\cite{chen2022group}。训练流程包含三个阶段:首先在 ImageNet-1K 数据集上对 ViT-Huge 编码器进行自监督预训练并微调;随后在 Object365 数据集上对检测器进行预训练;最后在 COCO 数据集上进行微调。Group DETR v2 在 COCO test-dev 上取得了 64.5 的 mAP 指标,在 COCO 目标检测排行榜上刷新了当前最优性能(SoTA),相关结果可查阅:https://paperswithcode.com/sota/object-detection-on-coco。