17日前

パッチの精緻化 — 局所的3次元オブジェクト検出

Johannes Lehner, Andreas Mitterecker, Thomas Adler, Markus Hofmarcher, Bernhard Nessler, Sepp Hochreiter
パッチの精緻化 — 局所的3次元オブジェクト検出
要約

本稿では、点群データから高精度な3D物体検出および局所化を実現するための二段階モデル「Patch Refinement」を紹介する。Patch Refinementは、独立して学習される2つのボクセルネット(VoxelNet)ベースのネットワーク、すなわち領域提案ネットワーク(Region Proposal Network: RPN)と局所精細化ネットワーク(Local Refinement Network: LRN)から構成される。本手法では、物体検出タスクを、初期の鳥瞰図(Bird's Eye View: BEV)検出ステップと、局所的な3D検出ステップに分解する。RPNによって提案されたBEV上の位置に基づき、小さな点群サブセット(「パッチ」)を抽出し、それらをLRNが処理する。各パッチの範囲が小さいため、LRNはメモリ制約の影響を受けにくく、局所的により高いボクセル解像度での符号化を適用できる。また、LRNが独立して設計されているため、追加のデータ拡張技術の利用が可能であり、シーン全体のわずかな部分のみを用いるため、効率的かつ回帰に特化した学習が実現できる。KITTI 3D物体検出ベンチマークにおいて、2019年1月28日付の提出結果は、車両クラスのすべての難易度において、従来のすべての提出結果を上回った。なお、この結果は利用可能な学習データの50%しか使用せず、LiDAR情報のみを用いて達成された。

パッチの精緻化 — 局所的3次元オブジェクト検出 | 最新論文 | HyperAI超神経