Command Palette
Search for a command to run...
DEVIANT: 単眼3D物体検出のための深度等変ネットワーク
DEVIANT: 単眼3D物体検出のための深度等変ネットワーク
Abhinav Kumar Garrick Brazil Enrique Corona Armin Parchami Xiaoming Liu
概要
現代のニューラルネットワークは、任意の2次元変換に対して等方変換性を持つ畳み込みなどの構成要素を使用しています。しかし、これらの基本的な構成要素は射影多様体における任意の3次元変換に対して等方変換性を持たないという問題があります。それでも、すべての単眼3次元検出器は3次元座標を取得するために基本的な構成要素を使用しており、これは基本的な構成要素が設計されていないタスクです。本論文では、射影多様体における任意の3次元変換に対して等方変換性を持つ畳み込みへの最初の一歩を踏み出します。単眼検出において最も推定が難しいのが奥行きであるため、本論文では既存のスケール等方変換性を持つステアラブルブロックを使用してDepth EquiVarIAnt NeTwork(DEVIANT)を提案します。その結果、DEVIANTは射影多様体における奥行き変換に対して等方変換性を持ちますが、基本的なネットワークは持たないのです。追加の奥行き等方変換性により、DEVIANTは一貫した奥行き推定を学習することが強制され、そのためKITTIおよびWaymoデータセットにおいて画像のみのカテゴリで最先端の単眼3次元検出結果を達成し、追加情報を利用する手法と競合する性能を発揮します。さらに、異なるデータセット間での評価でもDEVIANTは基本的なネットワークよりも優れた性能を示しました。コードとモデルは https://github.com/abhi1kumar/DEVIANT で公開されています。