17日前

RADAM：深層活性マップのランダム化集約符号化を用いたテクスチャ認識

Leonardo Scabini, Kallil M. Zielinski, Lucas C. Ribas, Wesley N. Gonçalves, Bernard De Baets, Odemir M. Bruno

要約

テクスチャ解析は、コンピュータビジョンにおいて古典的でありながらも依然として挑戦的な課題であり、深層ニューラルネットワークが積極的に応用されている分野である。従来の大多数の手法は、事前学習済みのバックボーンを基盤として特徴量集約モジュールを構築し、その後、特定のテクスチャ認識タスク上で新しいアーキテクチャを微調整するものである。本研究では、バックボーンを一切変更せずに豊かなテクスチャ表現を抽出する新たな手法、すなわち「Random encoding of Aggregated Deep Activation Maps（RADAM）」を提案する。本手法は、事前学習済みの深層畳み込みネットワークの異なる層における出力を、ランダム化オートエンコーダー（RAE: Randomized Autoencoder）を用いて符号化するものである。RAEは各画像ごとに閉じた形の解（closed-form solution）を用いて局所的に学習され、そのデコーダーの重みを用いて1次元のテクスチャ表現を構成し、線形SVM（SVM: Support Vector Machine）に供給する。このため、微調整や逆伝播（backpropagation）は一切不要となる。我々はRADAMを複数のテクスチャベンチマークで検証し、異なる計算リソース制約下でも最先端の性能を達成した。これらの結果から、事前学習されたバックボーンの学習済み表現が適切に符号化されるならば、テクスチャ認識のための追加的な微調整は必要ない可能性が示唆される。