19 天前
仅使用公开数据集的强鲁棒性与可复现性目标检测器
Tianhe Ren, Jianwei Yang, Shilong Liu, Ailing Zeng, Feng Li, Hao Zhang, Hongyang Li, Zhaoyang Zeng, Lei Zhang

摘要
本工作提出Focal-Stable-DINO,一种强大且可复现的目标检测模型,在仅使用7亿参数的情况下,无需任何测试时增强(test-time augmentation),即可在COCO val2017上达到64.6 AP,在COCO test-dev上达到64.8 AP。该模型结合了性能强大的FocalNet-Huge主干网络与高效稳定的Stable-DINO检测器。与现有SOTA模型依赖大量参数、复杂的训练技术以及大规模私有数据或合并数据集不同,本模型仅在公开可用的Objects365数据集上进行训练,从而确保了方法的可复现性。