16日前
スパースTransformerを活用したシングルストライド3Dオブジェクト検出器の採用
Lue Fan, Ziqi Pang, Tianyuan Zhang, Yu-Xiong Wang, Hang Zhao, Feng Wang, Naiyan Wang, Zhaoxiang Zhang

要約
自律走行を目的としたLiDARを用いた3Dオブジェクト検出において、オブジェクトサイズと入力シーンサイズの比は2D検出の場合と比べて著しく小さい。この違いを無視し、多くの3D検出器は2D検出器の一般的な手法に従い、点群を量子化した後も特徴マップのダウンサンプリングを実施している。本論文では、このようなマルチストライドの定型的手法がLiDARベース3Dオブジェクト検出器に与える影響を再考することから始める。実験の結果、ダウンサンプリング操作はほとんど利点をもたらさず、必然的に情報損失を引き起こすことが明らかになった。この問題を解決するため、ネットワークの最初から最後まで元の解像度を維持する「シングルストライドスパーストランスフォーマー(SST)」を提案する。トランスフォーマーを活用することで、シングルストライドアーキテクチャにおける受容野の不足という課題を効果的に解決できる。また、点群のスパース性と良好に連携し、計算コストの高い処理を自然に回避できる。最終的に、SSTは大規模なWaymo Open Datasetにおいて最先端の性能を達成した。特に注目すべきは、シングルストライドの特性により、小型オブジェクト(歩行者)検出においても優れた性能(バリデーションスプリットで83.8 LEVEL 1 AP)を発揮した点である。コードは https://github.com/TuSimple/SST にて公開予定。