18日前
ガウス混合モデルを指向した判別学習を用いた弱教師あり微細分類画像分類
{ Zezhou Li, Jianjun Li, Haojie Li, Shuhui Yang, Shijie Wang, Zhihui Wang}

要約
従来の弱教師あり細分類画像認識(WFGIR)手法は、通常、高レベルの特徴マップから判別的な領域を直接抽出する。本研究では、畳み込みニューラルネットワーク(CNN)における局所受容野の積み重ね操作により、高レベル特徴マップ上での判別的領域が拡散する現象が生じ、結果として判別的領域の局所化が不正確になることを発見した。本論文では、この判別的領域の拡散問題を解決し、より優れた細分類的詳細を捉えることを目的として、エンドツーエンド型の判別的特徴指向型ガウス混合モデル(DF-GMM)を提案する。具体的には、DF-GMMは以下の2つの機構から構成される:1)低ランク表現機構(LRM):高レベルの意味特徴マップにおいてガウス混合モデル(GMM)を用いて、低ランクな判別的基底を学習することで、特徴表現の判別能力を向上させる。2)低ランク表現再構成機構(LR²M):低ランク判別的基底に対応する空間情報を復元し、低ランク特徴マップを再構成することで、判別的領域の拡散を緩和し、より正確に判別的領域を局所化する。広範な実験により、CUB-Bird、Stanford-Cars、FGVC Aircraftの各データセットにおいて、同じ設定下で他の最先端手法と比較して最も優れた性能を達成することが確認された。