2ヶ月前

不確実性を考慮したバウンディングボックス回帰による高精度な物体検出

Yihui He; Chenchen Zhu; Jianren Wang; Marios Savvides; Xiangyu Zhang
不確実性を考慮したバウンディングボックス回帰による高精度な物体検出
要約

大規模物体検出データセット(例:MS-COCO)では、真値のバウンディングボックスをできるだけ明確に定義しようと試みています。しかし、バウンディングボックスのラベリング時に曖昧さが依然として導入されることが観察されています。本論文では、バウンディングボックスの変換と位置特定の分散を同時に学習する新しいバウンディングボックス回帰損失を提案します。当社の損失は、ほぼ追加計算なしで様々なアーキテクチャの位置特定精度を大幅に向上させます。学習された位置特定の分散により、非最大値抑制(Non-Maximum Suppression, NMS)中に隣接するバウンディングボックスをマージすることができます。これにより位置特定性能がさらに向上します。MS-COCOにおいて、VGG-16 Faster R-CNNの平均精度(Average Precision, AP)を23.6%から29.1%に向上させました。より重要なことに、ResNet-50-FPN Mask R-CNNに対して、当社の手法はAPとAP90をそれぞれ1.8%と6.2%向上させ、これは従来の最先端のバウンディングボックス精緻化手法を大幅に上回る結果となっています。コードとモデルは以下のURLから入手可能です:github.com/yihui-he/KL-Loss