
要約
深層ニューラルネットワークの正則化は、過学習問題を回避しつつ高い汎化性能を達成する上で重要な課題となっています。ドロップアウトという人気のある手法は正則化効果を提供しますが、出力に一貫性のない特性をもたらし、これが深層ニューラルネットワークの性能を低下させる可能性があります。本研究では、プーリングにドロップアウトのような確率的な要素を取り入れた新しいモジュールである「確率的平均プーリング」を提案します。私たちは確率的サブサンプリングと平均プーリングの特性について説明し、それらを利用して一貫性の問題がないモジュールを設計しました。確率的平均プーリングは一貫性問題による潜在的な性能低下なしに正則化効果を達成でき、既存の深層ニューラルネットワークのアーキテクチャに簡単に組み込むことができます。実験結果は、既存の平均プーリングを確率的平均プーリングに置き換えることで、様々なタスク、データセット、モデルにおいて一貫した改善が得られることを示しています。