2ヶ月前
Contrast with Reconstruct: Contrastive 3D Representation Learning Guided by Generative Pretraining 対照と再構築:生成事前学習によって誘導される対照的な3D表現学習
Qi, Zekun ; Dong, Runpei ; Fan, Guofan ; Ge, Zheng ; Zhang, Xiangyu ; Ma, Kaisheng ; Yi, Li

要約
主流の3次元表現学習手法は、対照的または生成モデルの前処理タスクに基づいて構築されており、さまざまな下流タスクにおいて性能が大幅に向上しています。しかし、これらの2つのパラダイムには異なる特性があることがわかりました。(i) 対照的モデルはデータ依存性が高く、表現の過学習問題に悩まされています。(ii) 生成モデルはデータ補完問題があり、対照的モデルと比較して劣るデータスケーリング能力を示しています。このため、両方のパラダイムの長所を共有することにより3次元表現を学習する方法を模索しましたが、2つのパラダイム間のパターンの違いにより、これは容易ではありません。本論文では、これら2つのパラダイムを統合する「再構成との対照(ReCon)」を提案します。ReConは、生成モデリング教師と単一/クロスモーダル対照教師から学ぶためにアンサンブルディスティレーションを通じて訓練されます。ここで生成学生が対照学生を導きます。また、エンコーダー-デコーダースタイルのReConブロックを提案し、勾配停止付きクロスアテンションを通じて知識転送を行うことで、事前学習の過学習とパターンの違いの問題を回避します。ReConは3次元表現学習において新しい最先端技術となりました。例えばScanObjectNNでの精度は91.26%です。コードは https://github.com/qizekun/ReCon で公開されています。