
要約
現代の畳み込みネットワークはシフト不変性を有していないため、入力の小さなシフトや並進が出力に大きな変化をもたらすことがあります。一般的に使用されているダウンサンプリング手法、例えば最大プーリング、ストライド畳み込み、平均プーリングはサンプリング定理を無視しています。よく知られている信号処理の解決策は、ダウンサンプリング前に低域フィルタリングを行うことでアンチエイリアシングを行うことです。しかし、このモジュールを深層ネットワークに単純に挿入すると性能が低下するため、今日ではほとんど使用されていません。我々は、適切に統合することで、最大プーリングやストライド畳み込みなどの既存のアーキテクチャ構成要素と互換性があることを示しました。ResNet、DenseNet、MobileNetなどいくつかの一般的に使用されるアーキテクチャにおいてImageNet分類での\textit{精度向上}を観察し、効果的な正則化が行われていることを示唆しています。さらに、入力の破壊に対する安定性と堅牢性という観点から\textit{より良い汎化能力}を観察しました。我々の結果は、この古典的な信号処理技術が現代の深層ネットワークで不当に見過ごされてきたことを示しています。コードおよび人気のあるネットワークのアンチエイリアシング版は https://richzhang.github.io/antialiased-cnns/ で利用可能です。