16日前

LiDARセグメンテーションのためのレンジビュー表現の再考

Lingdong Kong, Youquan Liu, Runnan Chen, Yuexin Ma, Xinge Zhu, Yikang Li, Yuenan Hou, Yu Qiao, Ziwei Liu
LiDARセグメンテーションのためのレンジビュー表現の再考
要約

LiDARセグメンテーションは自動運転における認識性能において極めて重要である。近年のトレンドでは、従来のレンジビュー表現に比べてより優れた性能を発揮する傾向があるため、ポイントベースまたはボクセルベースの手法が好まれている。本研究では、強力なレンジビューモデルを構築する上で重要な複数の要因を明らかにした。具体的には、「多対一」マッピング、意味的不整合性、形状の変形が、レンジビュー投影からの有効な学習を妨げる可能性があると観察した。そこで、ネットワークアーキテクチャ、データ拡張、後処理の各段階に新たな設計を統合したフルサイクルフレームワーク「RangeFormer」を提案する。このフレームワークにより、レンジビューから得られるLiDAR点群データの学習と処理をより効果的に実現できる。さらに、任意の低解像度2Dレンジ画像上で学習可能な「スケーラブル・トレーニング・フロム・レンジビュー(STR)」戦略を導入し、依然として高い3Dセグメンテーション精度を維持することを実現した。本研究では、初めてレンジビュー手法が、ポイント、ボクセル、マルチビュー融合手法と競合するLiDARセマンティックおよびパンスペクティックセグメンテーションベンチマーク(SemanticKITTI、nuScenes、ScribbleKITTI)において、いずれも優れた性能を達成することを示した。

LiDARセグメンテーションのためのレンジビュー表現の再考 | 最新論文 | HyperAI超神経