
要約
自動運転における正確かつ高速なシーン理解は、LiDARポイントクラウドを活用してセマンティックセグメンテーションを行う必要があるため、依然として挑戦的な課題の一つです。本論文では、\textbf{簡潔で効率的な} 画像ベースのセマンティックセグメンテーションネットワークである \textbf{CENet} を提案します。学習された特徴量の表現力を向上させ、計算量および時間複雑さを削減するために、CENetはMLPに代わる大規模なカーネルサイズを持つ畳み込み、慎重に選択された活性化関数、および対応する損失関数を持つ複数の補助セグメンテーションヘッドをアーキテクチャに統合しています。SemanticKITTIおよびSemanticPOSSという公開ベンチマークでの定量的および定性的実験により、当社のパイプラインが最先端モデルと比較して大幅に優れたmIoU(平均交差・Union)および推論性能を達成していることが示されています。コードは https://github.com/huixiancheng/CENet で公開予定です。