2ヶ月前
円筒形および非対称3D畳み込みネットワークを用いたLiDARセグメンテーション
Xinge Zhu; Hui Zhou; Tai Wang; Fangzhou Hong; Yuexin Ma; Wei Li; Hongsheng Li; Dahua Lin

要約
大規模な運転シーンLiDARセグメンテーションの最先端手法は、点群を2次元空間に投影し、その後2次元畳み込みを用いて処理することが多いです。このアプローチは点群において競争力を示していますが、必然的に3次元トポロジーと幾何学的関係が変更されたり、失われたりするという問題があります。自然な解決策として、3次元ボクセル化と3次元畳み込みネットワークの利用が考えられます。しかし、我々は屋外点群においてこの方法で得られる改善が非常に限られていることを発見しました。重要な理由の一つは、屋外点群の特性である疎性と密度の変動性にあると考えられます。この調査結果に基づき、我々は新たな屋外LiDARセグメンテーションフレームワークを提案します。このフレームワークでは、円筒分割と非対称3次元畳み込みネットワークを設計することで、3次元幾何学的パターンを探求しつつこれらの固有特性を維持することを目指しています。さらに、損失のあるボクセルベースのラベルエンコーディングによる干渉を軽減するために、ポイントワイズリファインメントモジュールを導入しています。提案されたモデルはSemanticKITTIおよびnuScenesという2つの大規模データセットで評価されました。我々の手法はSemanticKITTIのリーダーボードで1位となり、nuScenesでは既存手法よりも約4%高い性能を示すなど、顕著な優位性を示しました。また、提案された3次元フレームワークはLiDARパノプティックセグメンテーションやLiDAR 3D検出にも良好に一般化することが確認されています。