11日前

BEV投影を用いた効率的な都市規模ポイントクラウドセグメンテーション

Zhenhong Zou, Yizhe Li
BEV投影を用いた効率的な都市規模ポイントクラウドセグメンテーション
要約

近年、点群データの解析は研究者たちの注目を集めるようになったが、3次元セマンティックセグメンテーションは依然として課題となっている。多くの深層学習モデルは3次元点群データに対して直接学習を実施するが、都市規模のデータにおいては点群の極度な疎性と膨大なデータ処理負荷により、性能が著しく制限される。この課題に対処するため、本研究では3次元点群を高密度な鳥瞰視点(bird's-eye-view)投影に変換する手法を提案する。これにより、クラスの不均衡が軽減され、さまざまな2次元セグメンテーション手法を活用可能な状態となるため、セグメンテーションタスクが簡素化される。さらに、投影された画像上でマルチモーダル学習が可能なアテンションベースの融合ネットワークを設計した。最終的に、得られた2次元の出力を再マッピングすることで、3次元セマンティックセグメンテーションの結果を生成する。提案手法の有効性を検証するため、SensatUrbanデータセットを用いた多数の実験を行った。その結果、本モデルは競争力ある評価結果(mIoU 61.17%、全体精度 91.37%)を達成した。本研究が、点群解析分野におけるさらなる探求を促進することを期待している。

BEV投影を用いた効率的な都市規模ポイントクラウドセグメンテーション | 最新論文 | HyperAI超神経