11日前

OA-CNNs:3次元セマンティックセグメンテーションのためのオムニ適応スパースCNN

Bohao Peng, Xiaoyang Wu, Li Jiang, Yukang Chen, Hengshuang Zhao, Zhuotao Tian, Jiaya Jia
OA-CNNs:3次元セマンティックセグメンテーションのためのオムニ適応スパースCNN
要約

2020年代における3次元認識の急成長は、ポイントクラウド変換器(point cloud transformers)の登場に端を発した。これらのモデルは、スパースCNN(sparse CNN)を急速に凌駕し、特に3次元セマンティックセグメンテーション分野で最先端の性能を達成した。しかし、スパースCNNはその高い計算効率と実装の容易さという利点から、依然として価値あるネットワークとして評価されている。本研究では、スパースCNNの設計的差異を再検討し、その性能限界を明らかにすることを目的とする。その結果、性能差の鍵となる要因は「適応性(adaptivity)」であることが判明した。具体的には、空間的に適応する受容 field(受容野)と、適応的な関係性を捉える機構の2つの重要な構成要素を提案し、このギャップを埋めることに成功した。この探求の結果、軽量モジュールを統合することでスパースCNNの適応性を大幅に向上させつつ、計算コストを最小限に抑える「オムニ適応型3次元CNN(Omni-Adaptive 3D CNNs, OA-CNNs)」というネットワーク群が開発された。自己注意機構(self-attention modules)を一切用いないにもかかわらず、OA-CNNsは屋内・屋外の両シーンにおいて、ポイント変換器を精度面で上回り、著しく低い遅延とメモリ消費量を実現した。特に、ScanNet v2、nuScenes、SemanticKITTIの検証ベンチマークにおいて、それぞれ76.1%、78.9%、70.6%のmIoU(mean Intersection over Union)を達成し、変換器系モデルと比較して最大5倍の高速性を維持した。この成果は、純粋なスパースCNNが変換器系ネットワークを凌駕する可能性を示しており、今後の3次元認識技術の設計に新たな視点を提供するものである。

OA-CNNs:3次元セマンティックセグメンテーションのためのオムニ適応スパースCNN | 最新論文 | HyperAI超神経