14日前

順列AdaIN:画像分類におけるグローバル統計へのバイアスを低減する

Oren Nuriel, Sagie Benaim, Lior Wolf
順列AdaIN:画像分類におけるグローバル統計へのバイアスを低減する
要約

近年の研究では、畳み込みニューラルネットワーク(CNN)分類器が形状の手がかりよりもテクスチャに過度に依存していることが示された。本研究では、形状および局所的画像特徴(局所画像ヒント)と、グローバル画像統計量との間に類似しつつも異なる区別を提示する。提案手法である「置換適応インスタンス正規化(Permuted Adaptive Instance Normalization; pAdaIN)」は、画像分類器の隠れ層におけるグローバル統計量の表現を低減する。pAdaINは、与えられたバッチ内のサンプルをランダムな置換 $π$ で並べ替える。その後、各サンプル $i$(置換されていない)の活性化値と、対応するサンプル $π(i)$ の活性化値の間に適応的インスタンス正規化(AdaIN)を適用することで、バッチ内のサンプル間で統計量を交換する。この交換プロセスにより、グローバル画像統計量が歪められ、ネットワークは形状やテクスチャといったより局所的な手がかりに依存するよう促される。ランダム置換を確率 $p$ で選択し、それ以外の場合は恒等置換(identity permutation)を採用することで、この効果の強度を制御できる。適切な $p$ の選択(すべての実験において事前に固定され、テストデータを考慮せずに選定)により、複数の設定においてベースラインを一貫して上回る性能を達成した。画像分類においては、複数のアーキテクチャを用いてCIFAR100およびImageNetの両方で性能向上を確認した。ロバスト性の設定では、ImageNet-CおよびCIFAR100-Cにおいて、複数のアーキテクチャでベースラインを改善した。ドメイン適応およびドメイン一般化の設定では、GTAVからCityscapesへの転移学習タスクおよびPACSベンチマークにおいて、それぞれ最先端の結果を達成した。

順列AdaIN:画像分類におけるグローバル統計へのバイアスを低減する | 最新論文 | HyperAI超神経