2ヶ月前

ドロップアウト、バッチ正規化、およびスキップ接続を用いたMLPの一般化

Kim, Taewoon
ドロップアウト、バッチ正規化、およびスキップ接続を用いたMLPの一般化
要約

多層パーセプトロン(MLP)は通常、非線形活性化関数を持つ複数の全結合層で構成されています。MLPの性能向上(例えば、収束速度の向上、より良い収束限界など)に向けた様々な手法が提案されてきましたが、それらを体系的にテストする方法が不足しています。本研究では、年齢と性別のデータセットを使用して異なるMLPアーキテクチャを実験的に評価しました。入力データを各線形層の前にホワイトニングし、スキップ接続を追加することで、提案したMLPアーキテクチャがより優れた性能を達成できることが実証されました。ホワイトニングプロセスにはドロップアウトが含まれているため、ベイジアン推論の近似にも利用できます。当方ではコードをオープンソース化し、モデルおよびDockerイメージをhttps://github.com/tae898/age-gender/ で公開しています。

ドロップアウト、バッチ正規化、およびスキップ接続を用いたMLPの一般化 | 最新論文 | HyperAI超神経