19日前

NMSが逆襲する

Jeffrey Ouyang-Zhang, Jang Hyun Cho, Xingyi Zhou, Philipp Krähenbühl
NMSが逆襲する
要約

検出変換器(DETR)は、学習中に一対一の二部マッチングを用いてクエリを一意な物体に直接変換することで、エンドツーエンド型の物体検出を実現している。近年、このモデルはCOCOデータセットにおいて、明白な洗練さをもって従来の検出器を上回っている。しかし、モデルアーキテクチャや学習スケジュールなど複数の点で従来の検出器と異なり、一対一のマッチングの有効性についてはまだ十分に理解されていない。本研究では、DETRにおける一対一のハンガリアンマッチングと、非最大抑制(NMS)を用いる従来の検出器における一対多のラベル割り当ての間に厳密な比較を行った。驚くべきことに、同じ設定下で一対多のラベル割り当てにNMSを適用した場合、標準的な一対一マッチングを常に上回り、最大で2.5 mAPの顕著な向上が得られた。本研究で提案する検出器は、従来のIoUベースのラベル割り当てを用いてDeformable-DETRを学習させ、ResNet50をバックボーンとして12エポック(1xスケジュール)で50.2のCOCO mAPを達成し、この設定下で既存のすべての従来型および変換器ベースの検出器を上回った。複数のデータセット、学習スケジュール、アーキテクチャにおいても、一対一の二部マッチングが高性能な検出変換器にとって必要ではないことを一貫して示した。さらに、検出変換器の成功の要因は、表現力豊かな変換器アーキテクチャにあると考察している。コードはhttps://github.com/jozhang97/DETAにて公開されている。

NMSが逆襲する | 論文 | HyperAI超神経