SeqFace: Die vollständige Nutzung von Sequenzinformationen für die Gesichtserkennung

Tiefe Faltungsneuronale Netze (CNNs) haben in den letzten Jahren die Leistungsfähigkeit der Gesichtserkennung (FR) erheblich verbessert. Fast alle CNNs in der FR werden auf sorgfältig beschrifteten Datensätzen trainiert, die eine große Anzahl von Identitäten enthalten. Allerdings sind solche hochwertigen Datensätze sehr teuer zu sammeln, was vielen Forschern die Möglichkeit nimmt, den Stand der Technik zu erreichen. In dieser Arbeit schlagen wir ein Framework vor, das SeqFace genannt wird, zur Lernung diskriminativer Gesichtseigenschaften. Neben einem traditionellen Identitätstrainingdatensatz kann das entwickelte SeqFace CNNs durch Verwendung eines zusätzlichen Datensatzes trainieren, der eine große Anzahl von Gesichtssequenzen aus Videos enthält. Des Weiteren werden die Label-Smoothing-Regularisierung (LSR) und ein neu vorgeschlagener diskriminativer Sequenzagent (DSA)-Verlust verwendet, um die Diskriminationsfähigkeit tiefer Gesichtseigenschaften durch vollständige Nutzung der Sequenzdaten zu verbessern. Unsere Methode erzielt ausgezeichnete Ergebnisse auf Labeled Faces in the Wild (LFW) und YouTube Faces (YTF), ausschließlich mit einem einzelnen ResNet. Der Code und die Modelle sind öffentlich online verfügbar (https://github.com/huangyangyu/SeqFace).