Command Palette
Search for a command to run...
Heterogene Gesichtsmerkmalsschätzung: Ein tiefes Multi-Task-Lernverfahren
Heterogene Gesichtsmerkmalsschätzung: Ein tiefes Multi-Task-Lernverfahren
Han Hu Jain Anil K. Wang Fang Shan Shiguang Chen Xilin
Zusammenfassung
Die Schätzung von Gesichtsmerkmalen hat zahlreiche potenzielle Anwendungen in der Videoüberwachung, der Gesichtserkennung und sozialen Medien. Obwohl bereits mehrere Methoden für die Schätzung von Gesichtsmerkmalen vorgeschlagen wurden, berücksichtigten die meisten dieser Ansätze während des Lernens von Merkmalen die Korrelationen zwischen Merkmalen sowie deren Heterogenität (z. B. ordinal gegenüber nominal, ganzheitlich gegenüber lokal) nicht explizit. In diesem Artikel präsentieren wir einen Deep Multi-Task Learning (DMTL)-Ansatz, um mehrere heterogene Merkmale aus einem einzigen Gesichtsbild gemeinsam zu schätzen. Im DMTL-Modell adressieren wir die Korrelationen und Heterogenität der Merkmale mithilfe von konvolutionellen neuronalen Netzwerken (CNNs), die sowohl gemeinsame Merkmalsdarstellungen für alle Merkmale als auch kategorienspezifische Merkmalsdarstellungen für die heterogenen Merkmale integrieren. Zudem führen wir eine neue, unbeschränkte Gesichtsdatenbank (LFW+) ein, eine Erweiterung der öffentlich verfügbaren LFW-Datenbank, die durch Crowdsourcing gewonnene, heterogene demografische Merkmale (Alter, Geschlecht und Rasse) enthält. Experimentelle Ergebnisse auf Benchmark-Datenbanken mit mehreren Gesichtsmerkmalen (MORPH II, LFW+, CelebA, LFWA und FotW) zeigen, dass der vorgeschlagene Ansatz eine überlegene Leistung im Vergleich zum Stand der Technik erzielt. Schließlich bestätigen Evaluierungen auf einer öffentlich verfügbaren Gesichtsdatenbank (LAP) mit nur einem Merkmal die hervorragende Verallgemeinerungsfähigkeit des vorgeschlagenen Ansatzes.