HyperAIHyperAI
vor 11 Tagen

Schnelle tiefe konvolutionale Gesichtserkennung in freier Umgebung unter Ausnutzung des Hard Sample Mining

{Anastasios Tefas, Paraskevi Nousi, Danai Triantafyllidou}
Abstract

Die Gesichtserkennung stellt eine zentrale Aufgabe der visuellen Informationsanalyse im Bereich des maschinellen Lernens dar. Der Aufstieg der Big Data hat zu einer massiven Ansammlung visueller Daten geführt, die einer effizienten und schnellen Analyse bedürfen. Deep-Learning-Methoden sind hierbei leistungsfähige Ansätze, da sich gezeigt hat, dass die Ausbildung mit großen, hochvariablen Datensätzen deren Wirksamkeit erheblich steigert. Allerdings erfordern diese Methoden oft rechenintensive Prozesse und führen zu Modellen mit hoher Komplexität. Wenn es darum geht, visuelle Inhalte in großen Datensätzen zu analysieren, wird die Modellkomplexität entscheidend für den Erfolg des Modells. In diesem Artikel wird ein leichtgewichtiges tiefes Faltungsneuronales Netzwerk (Convolutional Neural Network, CNN) für die Gesichtserkennung vorgestellt, das darauf ausgelegt ist, Trainings- und Testzeiten zu minimieren. Es übertrifft bisher veröffentlichte tiefe Faltungsnetzwerke hinsichtlich Effektivität und Effizienz bei dieser Aufgabe. Das Modell verfügt über lediglich 76.375 freie Parameter, während die meisten konkurrierenden Modelle Millionen von Parametern enthalten. Um dieses leichte tiefes Netzwerk effizient zu trainieren, ohne dessen Effizienz zu beeinträchtigen, wird ein neues Trainingsschema basierend auf der schrittweisen Auswahl positiver und schwieriger negativer Trainingsbeispiele vorgestellt, das sich als stark beschleunigend und präzisionssteigernd erwiesen hat. Zudem wurde ein separates tiefes Netzwerk zur Erkennung einzelner Gesichtsmerkmale trainiert, und ein kombiniertes Modell, das die Ausgaben beider Netzwerke integriert, wurde entwickelt und evaluiert. Beide Ansätze sind in der Lage, Gesichter auch unter starker Verdeckung und bei beliebigen Posevariationen zu erkennen und erfüllen die Anforderungen sowie die hohen Variabilitäten realer, großskaliger, Echtzeit-Gesichtserkennungsaufgaben.

Schnelle tiefe konvolutionale Gesichtserkennung in freier Umgebung unter Ausnutzung des Hard Sample Mining | Neueste Forschungsarbeiten | HyperAI