17日前

品質に依存しない画像認識における逆変換デコーダーの活用

{Jinwoo Shin, Jae-Joon Han, Seong-Jin Park, Ji-won Baek, Seungju Han, Insoo Kim}
品質に依存しない画像認識における逆変換デコーダーの活用
要約

画像認識タスクにおいて深層学習モデルは顕著な性能を発揮しているものの、ぼかし、ノイズ、低解像度といった一般的な劣化に対して脆弱であることが知られている。データ拡張は、学習過程においてこれらの一般的な劣化を考慮することで、モデルの耐障害性を高める従来の手法である。しかし、単純なデータ拡張手法では、モデルが異なる劣化の平均的な分布を学習しようとするため、特定の劣化に対して特化した性能を発揮しない非特化型のモデルとなる可能性がある。この問題を緩和するため、本研究では、任意の品質の画像からクリーン画像に類似した特徴を生成する可逆ニューラルアーキテクチャを用いた深層画像認識ネットワークの新しい訓練パラダイムを提案する。本手法は2段階のプロセスから構成される。第1段階では、クリーン画像のみを用いて、認識タスクを目的関数とする可逆ネットワークを学習する。第2段階では、その逆変換(すなわち可逆デコーダー)を新たな認識ネットワークに接続し、クリーン画像と劣化画像の両方を用いて、認識と再構成の2つの目的関数を考慮して、エンコーダ・デコーダ構造のネットワークを学習する。本2段階のアプローチにより、可逆デコーダを介して劣化画像をクリーン画像に再構成することで、任意の品質の入力画像からクリーンに類似した耐障害性の高い特徴を生成することが可能となる。提案手法の有効性は、画像分類および顔認識タスクにおいて実証された。

品質に依存しない画像認識における逆変換デコーダーの活用 | 最新論文 | HyperAI超神経