Faltungsneuronales Netzwerk LeNet
LeNet, auch bekannt als LeNet-5, ist eine frühe Convolutional Neural Network (CNN)-Architektur, die 1997 von Yann LeCun und seinem Team speziell für Aufgaben zur Erkennung handschriftlicher Ziffern entwickelt wurde. Papier"Gradientenbasiertes Lernen zur Dokumentenerkennung„Die Netzwerkstruktur und der Trainingsprozess von LeNet-5 werden ausführlich vorgestellt.
LeNet-5 ist eine Pionierarbeit auf dem Gebiet des Deep Learning und der Convolutional Neural Networks, die den Grundstein für viele Schlüsselkonzepte des modernen Deep Learning legte, wie etwa Convolutional Layers, Pooling Layers und Fully Connected Layers.
Die Architektur von LeNet-5 ist relativ einfach und besteht aus insgesamt 7 Schichten (ohne die Eingabeschicht), darunter zwei Faltungsschichten (C1 und C3), zwei Pooling-Schichten (S2 und S4), gefolgt von zwei vollständig verbundenen Schichten (F6 und der Ausgabeschicht). Die Faltungsschicht ist für das Extrahieren von Bildmerkmalen verantwortlich, während die Pooling-Schicht für die Reduzierung der räumlichen Dimension der Merkmale bei gleichzeitiger Erhöhung der Invarianz gegenüber Bildverschiebungen verantwortlich ist. Die letzte vollständig verbundene Schicht wird für Klassifizierungsaufgaben verwendet.