Command Palette
Search for a command to run...
SCUT-FBP5500: Ein vielfältiges Benchmark-Datenset für die multimodale Vorhersage von Gesichtsschönheit
SCUT-FBP5500: Ein vielfältiges Benchmark-Datenset für die multimodale Vorhersage von Gesichtsschönheit
Liang Lingyu Lin Luojun Jin Lianwen Xie Duorui Li Mengru
Zusammenfassung
Die Vorhersage von Gesichtsschönheit (Facial Beauty Prediction, FBP) stellt ein bedeutendes Problem des visuellen Erkennungswissens dar, da sie eine Bewertung der Gesichtsattraktivität ermöglicht, die mit der menschlichen Wahrnehmung konsistent ist. Um dieses Problem zu bewältigen, wurden verschiedene datenbasierte Modelle, insbesondere moderne tiefen Lernverfahren, eingeführt, wobei Benchmark-Datensätze zu einem essenziellen Bestandteil der FBP-Entwicklung wurden. Frühere Arbeiten haben die Erkennung von Gesichtsschönheit als ein spezifisches überwachtes Lernproblem im Sinne von Klassifikation, Regression oder Ranking formuliert, was darauf hindeutet, dass FBP ursächlich ein rechnerisches Problem mit mehreren Paradigmen darstellt. Allerdings wurden die meisten existierenden FBP-Benchmark-Datensätze unter bestimmten rechnerischen Beschränkungen erstellt, was die Leistungsfähigkeit und Flexibilität der darauf trainierten Modellen einschränkt. In diesem Artikel argumentieren wir, dass FBP ein mehrparadigmatisches rechnerisches Problem ist, und stellen einen neuen, vielfältigen Benchmark-Datensatz namens SCUT-FBP5500 vor, um eine multi-paradigmatische Vorhersage von Gesichtsschönheit zu ermöglichen. Der SCUT-FBP5500-Datensatz umfasst insgesamt 5500 vorderansichtige Gesichter mit vielfältigen Eigenschaften (männlich/weiblich, asiatisch/kaukasisch, Altersgruppen) sowie vielfältigen Etiketten (Gesichtslandmarken, Schönheitswerte im Bereich [1, 5], Verteilung der Schönheitswerte), was unterschiedliche rechnerische Modelle mit verschiedenen FBP-Paradigmen erlaubt, beispielsweise auf Erscheinungsbasis oder Formbasis basierende Klassifikations- oder Regressionsmodelle für männliche und weibliche Gesichter unterschiedlicher ethnischer Herkunft (asiatisch/kaukasisch). Wir haben den SCUT-FBP5500-Datensatz hinsichtlich der FBP anhand verschiedener Kombinationen aus Merkmalen und Vorhersagemodellen sowie unterschiedlicher tiefen Lernmethoden evaluiert. Die Ergebnisse zeigen eine Verbesserung der FBP-Leistung und verdeutlichen das Potenzial für zukünftige Anwendungen auf Basis des SCUT-FBP5500-Datensatzes.