HyperAIHyperAI
vor 12 Tagen

Genauige Gesichtsbildanalyse in Echtzeit-Geschwindigkeit

{Hefei Ling, Yao Sun, Si Liu, Zhen Wei}
Abstract

In diesem Artikel schlagen wir einen Entwurfsansatz für Deep-Learning-Netzwerke im Bereich der Gesichtsaufteilung (face parsing) mit vielversprechender Genauigkeit und Echtzeit-Inferenzgeschwindigkeit vor. Durch die Analyse der Unterschiede zwischen dem allgemeinen Bildaufteilungsaufgabe und der Gesichtsaufteilungsaufgabe überprüfen wir zunächst die Struktur herkömmlicher FCN (Fully Convolutional Networks) und treffen Verbesserungen, um sie den spezifischen Eigenschaften der Gesichtsaufteilungsaufgabe anzupassen. Insbesondere wird der Begriff des Normalisierten Rezeptiven Feldes eingeführt, um tiefere Einblicke in die Netzwerkgestaltung zu ermöglichen. Anschließend wird eine neuartige Verlustfunktion namens Statistical Contextual Loss vorgestellt, die reichhaltigere kontextuelle Informationen integriert und die Merkmale während des Trainings regularisiert. Zur weiteren Beschleunigung des Modells wird ein halbüberwachtes Distillationsschema vorgeschlagen, das das erlernte Wissen effizient in ein leichteres Netzwerk überträgt. Umfangreiche Experimente auf den Datensätzen LFW und Helen belegen die deutliche Überlegenheit des neuen Entwurfsansatzes sowohl hinsichtlich Effizienz als auch Leistungsfähigkeit.

Genauige Gesichtsbildanalyse in Echtzeit-Geschwindigkeit | Neueste Forschungsarbeiten | HyperAI