HyperAIHyperAI

Command Palette

Search for a command to run...

2D画像および3Dポイントクラウドにおける継続的セマンティックセグメンテーションのためのラベル誘導型知識蒸留

Guosheng Lin Minhoe Hur Keng Teck Ma Dezhao Huang Yiming Wang Chi Zhang Evan Ling Ruibo Li Ze Yang

概要

継続的セマンティックセグメンテーション(CSS)は、既存のモデルを新たな未観測タスクに対応可能に拡張しつつ、従来の知識を保持することを目的としている。新データ上で古いモデルを単純にファインチューニングすると、 catastrophical forgetting(災害的忘却)が発生する。一般的な解決策として、知識蒸留(Knowledge Distillation, KD)が用いられる。KDでは、新モデルの出力分布が古いモデルの出力分布と類似するように正則化される。しかし、CSSにおいては、背景のシフト(background shift)問題により、このアプローチが困難となる。従来のKDに基づくCSS手法は、蒸留のための信頼性のあるクラス対応関係を確立できていないため、背景クラスと新規クラスの間に混乱が生じ続けている。この問題に対処するために、本研究では新しいラベル誘導型知識蒸留(Label-guided Knowledge Distillation, LGKD)損失関数を提案する。この手法では、正解ラベルのガイドのもと、古いモデルの出力を拡張・移植し、新モデルの出力と意味的に適切なクラス対応関係を構築する。その結果、古いモデルから有用な知識を混乱を引き起こすことなく効果的に新モデルに蒸留することが可能となる。本研究では、代表的なCSSベンチマークであるPascal-VOCおよびADE20K上で広範な実験を実施した。その結果、LGKDは3つの競合手法の性能を著しく向上させ、特に新規クラスにおけるmIoU(mean Intersection over Union)で最大+76%の向上を達成し、新たなSOTA(最先端)を樹立した。さらに、汎化能力を実証するため、ScanNetを基盤とした初めての3D点群ベースのCSSベンチマークを導入し、複数の再実装されたベースラインと比較した。実験結果から、LGKDが2Dおよび3Dの両モダリティにおいて汎用性を有しており、特化した設計を必要としないことが明らかになった。実装コードは以下のURLで公開されている:https://github.com/Ze-Yang/LGKD


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています