A-LINK: Erkennung maskierter Gesichter mittels aktiven Lernens basierend auf interdomänenwissen
Neuere Fortschritte im Bereich des tiefen Lernens haben die Fähigkeiten der Gesichtserkennung erheblich verbessert. Dennoch stellt die Gesichtserkennung in ungehinderten Umgebungen weiterhin eine aktive Forschungsherausforderung dar. Kovariaten wie Pose und geringe Auflösung haben erhebliche Aufmerksamkeit erhalten, während „Verkleidung“ als besonders herausfordernde Kovariate der Gesichtserkennung gilt. Ein zentraler Grund hierfür ist die Unverfügbarkeit großer und repräsentativer Datensätze. Um das Problem der Erkennung verkleideter Gesichter anzugehen, schlagen wir einen aktiven Lernrahmen namens A-LINK vor, der gezielt Trainingsbeispiele aus den Ziel-Domänen-Daten auswählt, um sicherzustellen, dass die Entscheidungsgrenze nicht übermäßig an eine bestimmte Variation angepasst wird und stattdessen eine bessere Generalisierung hinsichtlich der Variabilität ermöglicht. Der Rahmen integriert zudem Domänenanpassung mit den aktiv ausgewählten Trainingsbeispielen, um das Netzwerk feinzustellen. Wir belegen die Wirksamkeit des vorgeschlagenen Ansatzes anhand der Datensätze DFW und Multi-PIE unter Verwendung modernster Modelle wie LCSSE und DenseNet.