Command Palette
Search for a command to run...
Ein leichter CNN für tiefe Gesichtsdarstellung mit verrauschten Etiketten
Ein leichter CNN für tiefe Gesichtsdarstellung mit verrauschten Etiketten
Wu Xiang He Ran Sun Zhenan Tan Tieniu
Zusammenfassung
Das Volumen von Faltungsneuralen Netzen (Convolutional Neural Networks, CNNs), die für die Gesichtserkennung vorgeschlagen wurden, wächst kontinuierlich an, um große Mengen an Trainingsdaten besser abbilden zu können. Wenn die Trainingsdaten aus dem Internet stammen, sind die zugehörigen Labels oft mehrdeutig und ungenau. In diesem Artikel wird ein Light CNN-Framework vorgestellt, das eine kompakte Embedding-Darstellung auf großen Gesichtsdatensätzen mit zahlreichen fehlerhaften Labels lernt. Zunächst führen wir eine Variante der Maxout-Aktivierung, namens Max-Feature-Map (MFM), in jede Faltungsschicht des CNNs ein. Im Gegensatz zur herkömmlichen Maxout-Aktivierung, die zur linearen Approximation einer beliebigen konvexen Aktivierungsfunktion mehrere Merkmalskarten nutzt, erreicht MFM dies durch einen Wettbewerbsmechanismus zwischen Merkmalskarten. MFM kann nicht nur verrauschte Signale von informativen Signalen trennen, sondern fungiert auch als Merkmalsauswahl zwischen zwei Merkmalskarten. Zweitens werden drei Netzwerke sorgfältig entworfen, um eine verbesserte Leistung zu erzielen, gleichzeitig aber die Anzahl der Parameter und die Rechenkosten zu reduzieren. Schließlich wird eine semantische Bootstrapping-Methode vorgeschlagen, um die Vorhersagen der Netzwerke konsistenter mit den fehlerhaften Labels zu machen. Experimentelle Ergebnisse zeigen, dass das vorgeschlagene Framework große, fehlerbehaftete Datensätze effizient nutzen kann, um ein leichtgewichtiges Modell zu lernen, das sowohl recheneffizient als auch speichereffizient ist. Das gelernte Einzelnetzwerk mit einer 256-dimensionalen Darstellung erreicht state-of-the-art-Ergebnisse auf verschiedenen Gesichtserkennungsbenchmarks, ohne dass eine Nachjustierung (Fine-tuning) erforderlich ist. Der Quellcode ist unter https://github.com/AlfredXiangWu/LightCNN verfügbar.