
要約
正規化手法は、畳み込みニューラルネットワーク(CNNs)において重要な構成要素です。これらの手法は、事前に定義されたピクセル集合で推定された統計値を使用してデータを標準化またはホワイトニングします。既存の研究が特定のタスク向けに正規化技術を設計しているのに対し、我々はスイッチ可能なホワイトニング(Switchable Whitening: SW)を提案します。SWは異なるホワイトニング手法や標準化手法を統一する一般的な形式を提供し、エンドツーエンドでこれらの操作間での切り替えを学習します。SWにはいくつかの利点があります。第一に、SWは異なるタスクに対して適切なホワイトニングまたは標準化の統計値を選択する能力を持ち(図1参照)、手動での設計なしで広範なタスクに適しています。第二に、異なる正規化器の利点を取り入れることにより、SWは様々な困難なベンチマークにおいてその対応する手法よりも一貫して性能向上を示します。第三に、SWはホワイトニングと標準化技術の特性を理解するための有用なツールとして機能します。我々はSWが画像分類(CIFAR-10/100, ImageNet)、セマンティックセグメンテーション(ADE20K, Cityscapes)、ドメイン適応(GTA5, Cityscapes)、および画像スタイル転送(COCO)において他の代替手法よりも優れた性能を発揮することを示しました。例えば、特別な工夫なしでADE20Kデータセットにおいて45.33%のmIoUという最先端の性能を達成しました。コードはhttps://github.com/XingangPan/Switchable-Whitening から入手可能です。