HyperAIHyperAI

Command Palette

Search for a command to run...

RADAM:深層活性マップのランダム化集約符号化を用いたテクスチャ認識

Leonardo Scabini Kallil M. Zielinski Lucas C. Ribas Wesley N. Gonçalves Bernard De Baets Odemir M. Bruno

概要

テクスチャ解析は、コンピュータビジョンにおいて古典的でありながらも依然として挑戦的な課題であり、深層ニューラルネットワークが積極的に応用されている分野である。従来の大多数の手法は、事前学習済みのバックボーンを基盤として特徴量集約モジュールを構築し、その後、特定のテクスチャ認識タスク上で新しいアーキテクチャを微調整するものである。本研究では、バックボーンを一切変更せずに豊かなテクスチャ表現を抽出する新たな手法、すなわち「Random encoding of Aggregated Deep Activation Maps(RADAM)」を提案する。本手法は、事前学習済みの深層畳み込みネットワークの異なる層における出力を、ランダム化オートエンコーダー(RAE: Randomized Autoencoder)を用いて符号化するものである。RAEは各画像ごとに閉じた形の解(closed-form solution)を用いて局所的に学習され、そのデコーダーの重みを用いて1次元のテクスチャ表現を構成し、線形SVM(SVM: Support Vector Machine)に供給する。このため、微調整や逆伝播(backpropagation)は一切不要となる。我々はRADAMを複数のテクスチャベンチマークで検証し、異なる計算リソース制約下でも最先端の性能を達成した。これらの結果から、事前学習されたバックボーンの学習済み表現が適切に符号化されるならば、テクスチャ認識のための追加的な微調整は必要ない可能性が示唆される。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています