2ヶ月前
GrooMeD-NMS: 単眼3Dオブジェクト検出のためのグループ化された数理微分可能なNMS
Kumar, Abhinav ; Brazil, Garrick ; Liu, Xiaoming

要約
現代の3D物体検出器は、エンドツーエンド学習のアイデアから大きく恩恵を受けている。しかし、それらの多くは推論時にのみ非最大値抑制(Non-Maximal Suppression, NMS)という後処理アルゴリズムを使用している。2D物体検出などのタスクでは、NMSを訓練パイプラインに組み込む試みが行われたが、NMSの非数学的な表現のために広く採用されなかった。本論文では、単眼3D物体検出向けに新しいグループ化された数値微分可能なNMS(GrooMeD-NMS)を提示し、ネットワークをNMS後のボックスに対する損失と共にエンドツーエンドで訓練する方法を提案する。まず、NMSを行列演算として定式化し、次に無教師学習によりボックスをグループ化およびマスキングして、NMSの単純な閉形式表現を得る。GrooMeD-NMSは訓練と推論パイプライン間の不一致を解消し、ネットワークが微分可能な方法で最適な3Dボックスを選択するように強制する。その結果、GrooMeD-NMSはKITTIベンチマークデータセットにおいて単眼ビデオベース手法と同等の性能を持つ最先端の単眼3D物体検出結果を達成した。コードとモデルは https://github.com/abhi1kumar/groomed_nms で公開されている。