HyperAIHyperAI
vor 2 Monaten

Ein leichtes CNN für eine tiefe Gesichtsdarstellung mit verrauschten Etiketten

Wu, Xiang ; He, Ran ; Sun, Zhenan ; Tan, Tieniu
Ein leichtes CNN für eine tiefe Gesichtsdarstellung mit verrauschten Etiketten
Abstract

Das Volumen von vorgeschlagenen Convolutional Neural Network (CNN)-Modellen für die Gesichtserkennung wächst stetig, um große Mengen an Trainingsdaten besser zu fitten. Wenn Trainingsdaten aus dem Internet bezogen werden, sind die Labels wahrscheinlich unklar und ungenau. In dieser Arbeit wird ein Light-CNN-Framework vorgestellt, das eine kompakte Einbettung auf großen Gesichtsdatensätzen mit zahlreichen verrauschten Labels erlernen kann. Zunächst führen wir eine Variante der Maxout-Aktivierung, genannt Max-Feature-Map (MFM), in jede Faltungsschicht des CNNs ein. Im Gegensatz zur Maxout-Aktivierung, die viele Feature Maps verwendet, um eine beliebige konvexe Aktivierungsfunktion linear zu approximieren, erreicht MFM dies durch einen Wettbewerbsmechanismus. MFM kann nicht nur verrauschte und informative Signale trennen, sondern auch als Featureselektion zwischen zwei Feature Maps fungieren. Zweitens werden drei Netzwerke sorgfältig entworfen, um bessere Leistung zu erzielen und gleichzeitig die Anzahl der Parameter und Rechenkosten zu reduzieren. Schließlich wird eine semantische Bootstrapping-Methode vorgeschlagen, um die Vorhersagen der Netzwerke konsistenter mit den verrauschten Labels zu machen. Experimentelle Ergebnisse zeigen, dass das vorgeschlagene Framework große Mengen an verrauschten Daten nutzen kann, um ein Light-Modell zu lernen, das effizient in Bezug auf Rechenkosten und Speicherplatz ist. Das gelernte einzelne Netzwerk mit einer 256-D-Darstellung erreicht standesgemäße Ergebnisse auf verschiedenen Gesichtsbenchmarks ohne Feinabstimmung (fine-tuning). Der Code wurde veröffentlicht unter https://github.com/AlfredXiangWu/LightCNN.

Ein leichtes CNN für eine tiefe Gesichtsdarstellung mit verrauschten Etiketten | Neueste Forschungsarbeiten | HyperAI