HyperAIHyperAI
vor 2 Monaten

VGGFace2: Ein Datensatz zur Erkennung von Gesichtern bei unterschiedlichen Pose und Alter

Qiong Cao; Li Shen; Weidi Xie; Omkar M. Parkhi; Andrew Zisserman
VGGFace2: Ein Datensatz zur Erkennung von Gesichtern bei unterschiedlichen Pose und Alter
Abstract

In dieser Arbeit stellen wir einen neuen, groß angelegten Gesichtserkennungsdatensatz vor, der VGGFace2 genannt wird. Der Datensatz enthält 3,31 Millionen Bilder von 9131 Personen, wobei durchschnittlich 362,6 Bilder pro Person vorhanden sind. Die Bilder wurden von Google Image Search heruntergeladen und weisen große Variationen in Haltung, Alter, Beleuchtung, Ethnizität und Beruf (z.B. Schauspieler, Athleten, Politiker) auf. Der Datensatz wurde mit drei Zielen gesammelt: (i) sowohl eine große Anzahl von Identitäten als auch eine große Anzahl von Bildern für jede Identität zu haben; (ii) einen großen Bereich an Haltungen, Altersstufen und Ethnizitäten abzudecken; und (iii) das Etikett-Rauschen zu minimieren. Wir beschreiben den Sammelprozess des Datensatzes insbesondere die automatisierten und manuellen Filterstufen, um eine hohe Genauigkeit der Bilder jeder Identität sicherzustellen. Um die Leistungsfähigkeit der Gesichtserkennung mit dem neuen Datensatz zu bewerten, trainieren wir ResNet-50-Convolutional Neural Networks (mit und ohne Squeeze-and-Excitation-Blöcken) auf VGGFace2, MS-Celeb-1M und deren Vereinigung und zeigen, dass das Training auf VGGFace2 zu einer verbesserten Erkennungsleistung bei verschiedenen Haltungen und Altersstufen führt. Schließlich demonstrieren wir unter Verwendung der auf diesen Datensätzen trainierten Modelle eine Spitzenleistung bei allen IARPA Janus-Gesichtserkennungsbenchmarks wie z.B. IJB-A, IJB-B und IJB-C, wobei wir den bisherigen Stand der Technik um ein erhebliches Maß übertreffen. Die Datensätze und Modelle sind öffentlich zugänglich.

VGGFace2: Ein Datensatz zur Erkennung von Gesichtern bei unterschiedlichen Pose und Alter | Neueste Forschungsarbeiten | HyperAI