11日前
アモルチド・フェーズ再構成:周波数領域における畳み込みニューラルネットワークのロバスト性の再考
Guangyao Chen, Peixi Peng, Li Ma, Jia Li, Lin Du, Yonghong Tian

要約
近年、畳み込みニューラルネットワーク(CNN)の一般化行動は、周波数成分の分解を用いた解釈手法を通じて徐々に明らかになってきている。しかし、画像の位相スペクトルが堅牢な視覚システムにおいて果たす重要性については、依然として軽視されている。本研究では、CNNが訓練画像の高周波成分と密接に関連する局所最適解に収束しやすいこと、一方で振幅スペクトルはノイズや一般的な劣化(corruptions)などによって容易に影響を受けることを指摘する。これに対して、多くの実証的研究は、人間が堅牢な認識を達成する際により多くの位相成分に依存していることを示している。この観察から、CNNの一般化行動について、一般的な摂動に対する耐性および分布外検出における新たな解釈が可能となり、現在の画像の位相スペクトルと干渉画像(distracter image)の振幅スペクトルを再結合することで設計された新しいデータ拡張アプローチが提唱される。この手法により生成されたサンプルは、CNNに位相成分から得られる構造的情報をより重視させるとともに、振幅の変動に対して堅牢性を維持するよう促す。複数の画像データセットにおける実験結果から、提案手法が一般的な劣化や表面変化への適応性、分布外検出、および adversarial 攻撃に対する耐性という多様な一般化およびキャリブレーションタスクにおいて、最先端の性能を達成することが示された。