畳み込みニューラル ネットワーク LeNet

LeNet (正式名は LeNet-5) は、1997 年に Yann LeCun と彼のチームによって、特に手書きの数字認識タスクのために開発された初期の畳み込みニューラル ネットワーク (CNN) アーキテクチャです。紙"文書認識に適用された勾配ベースの学習LeNet-5のネットワーク構造とトレーニングプロセスを詳しく紹介します。

LeNet-5 は、ディープ ラーニングと畳み込みニューラル ネットワークの分野における独創的な作品であり、畳み込み層、プーリング層、完全接続層など、現代のディープ ラーニングの多くの重要な概念の基礎を築きました。

LeNet-5 のアーキテクチャは比較的単純で、2 つの畳み込み層 (C1 と C3)、2 つのプーリング層 (S2 と S4)、およびそれに続く 2 つの完全接続層を含む、合計 7 つの層 (入力層を除く) が含まれています。 F6 と出力レイヤー)。畳み込み層は画像の特徴を抽出する役割を果たし、プーリング層は画像の変位に対する不変性を高めながら特徴の空間次元を削減する役割を担います。最後の完全に接続された層は分類タスクに使用されます。