HyperAIHyperAI

Command Palette

Search for a command to run...

段階的受容領域成分推論を用いたオムニ監視型ポイントクラウドセグメンテーション

Jingyu Gong Jiachen Xu Xin Tan Haichuan Song Yanyun Qu Yuan Xie Lizhuang Ma

概要

ニューラルネットワークにおける隠れ特徴量は、通常、出力予測にのみ教師信号が与えられるため、3次元セグメンテーションのための情報量豊かな表現を学習できず、その問題は中間層におけるオムニスケールの教師信号によって解決可能である。本論文では、提案する段階的受容野成分推論(Gradual Receptive Field Component Reasoning; RFCR)により、点群セグメンテーションにおいて初めてオムニスケールの教師信号手法を導入した。具体的には、エンコーダ内の隠れユニットの受容野内に含まれるカテゴリ情報を記録するためのターゲット受容野成分コード(Target Receptive Field Component Codes; RFCCs)を設計し、それらをデコーダが粗い段階から細かい段階へと段階的に推論するカテゴリ推論のアプローチで、逐次的にRFCCを推定することで最終的に意味的ラベルを獲得する。多くの隠れ特徴量はその大きさが極めて小さく、RFCCの予測に対して微小な寄与しかしないため、より明確な特徴量を獲得するため、遠心力ポテンシャルを用いた特徴量の密度化(Feature Densification)を提案する。この手法は特徴量に対するエントロピー正則化と本質的に等価である。より活性化された特徴量は、本手法のオムニ教師信号の潜在能力をさらに引き出すことができる。本手法は4つの代表的なバックボーンに組み込み、3つの困難なベンチマークで評価した結果、すべてのデータセットにおいてバックボーンの性能を顕著に向上させた。特に、S3DISおよびSemantic3Dでは新たな最先端(SOTA)性能を達成し、ScanNetベンチマークにおいても点群ベースの手法の中で1位を獲得した。コードは公開予定であり、https://github.com/azuki-miho/RFCR にて入手可能となる。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています