HyperAI

Pooling

Pooling, auch als räumliches Pooling bekannt, ist eine Methode zum Extrahieren von Merkmalen in Convolutional Neural Networks. Es aggregiert und verarbeitet verschiedene Merkmale statistisch, um eine relativ niedrigere Dimension zu erhalten und gleichzeitig eine Überanpassung zu vermeiden.

Durch Pooling werden die Abmessungen jeder Feature-Map reduziert, während die meisten wichtigen Informationen erhalten bleiben. Derzeit sind dies vor allem Maximierung, Mittelwertbildung und Summation.

Gemeinsame Pooling-Operationen

Die häufigsten Pooling-Operationen sind Mean Pooling und Max Pooling.

  • Durchschnittliches Pooling:Berechnen Sie den Durchschnittswert des Bildbereichs und verwenden Sie ihn als zusammengefassten Wert des Bereichs.
  • Maximales Pooling:Wählen Sie den Maximalwert des Bildbereichs und verwenden Sie ihn als zusammengefassten Wert des Bereichs.

Definieren Sie eine räumliche Nachbarschaft und nehmen Sie das größte Element aus der geänderten Feature-Map oder nehmen Sie den Durchschnitt.

Die Rolle des Poolings

Die Pooling-Funktion kann den räumlichen Maßstab der Eingabedarstellung schrittweise reduzieren:

  • Durch die Reduzierung der Merkmalsdimensionen kann die Anzahl der Parameter und Berechnungen im Netzwerk auf eine besser kontrollierbare Weise reduziert werden.
  • Machen Sie das Netzwerk invariant gegenüber kleineren Änderungen, Redundanzen und Transformationen im Eingabebild.
  • Hilft dabei, die maximale Maßstabsinvarianz des Bildes zu erreichen.