19日前
公開データセットのみを用いた強力かつ再現性の高いオブジェクト検出器
Tianhe Ren, Jianwei Yang, Shilong Liu, Ailing Zeng, Feng Li, Hao Zhang, Hongyang Li, Zhaoyang Zeng, Lei Zhang

要約
本研究では、Focal-Stable-DINOと呼ばれる強力かつ再現性の高い物体検出モデルを提案する。このモデルは、テスト時増強(test time augmentation)を一切用いず、7億パラメータ(700M parameters)のみを用いて、COCO val2017で64.6 AP、COCO test-devで64.8 APを達成した。本モデルは、強力なFocalNet-Hugeバックボーンと効果的なStable-DINO検出器の組み合わせを探索したものである。既存の最先端(SOTA)モデルが大規模なプライベートデータや統合データを用い、膨大なパラメータ数と複雑な学習手法を採用しているのに対し、本モデルは公開データセットであるObjects365にのみ基づいて訓練されており、アプローチの再現可能性を確保している。