HyperAIHyperAI
vor 2 Monaten

Ein hybrider Ansatz von Transformer und Sequencer für die Alters- und Geschlechtsklassifizierung aus wilden Gesichtsbildern

Singh, Aakash ; Singh, Vivek Kumar
Ein hybrider Ansatz von Transformer und Sequencer für die Alters- und Geschlechtsklassifizierung aus wilden Gesichtsbildern
Abstract

Die Fortschritte in der Computer Vision und den Bildverarbeitungstechniken haben zu neuen Anwendungen im Bereich der visuellen Überwachung, personalisierten Werbung, inhaltsbasierten Suchen und der Mensch-Computer-Interaktion geführt. Unter den verschiedenen Techniken der Computer Vision hat insbesondere die Gesichtsanalyse viel Aufmerksamkeit erhalten. Mehrere frühere Studien haben versucht, verschiedene Anwendungen der Verarbeitung von Gesichtseigenschaften für eine Vielzahl von Aufgaben zu erforschen, darunter Alters- und Geschlechtsklassifizierung. Trotzdem sind die Alters- und Geschlechtsklassifizierung von realen menschlichen Gesichtern noch weit davon entfernt, die für praktische Anwendungen erforderliche Genauigkeit zu erreichen. Dieses Papier versucht daher, diese Lücke zu schließen, indem es ein hybrides Modell vorschlägt, das Selbst-Aufmerksamkeit (self-attention) und bidirektionale LSTMs (BiLSTM) kombiniert, um Alters- und Geschlechtsklassifizierungsprobleme zu lösen. Die Leistung des vorgeschlagenen Modells wird mit mehreren bisher vorgestellten Stand-of-the-Art-Modellen verglichen. Es wird eine Verbesserung von etwa 10 Prozent bei der Altersklassifizierung und 6 Prozent bei der Geschlechtsklassifizierung gegenüber den bisherigen Stand-of-the-Art-Implementierungen festgestellt. Das vorgeschlagene Modell erzielt somit überlegene Ergebnisse und bietet ein allgemeineres Lernen. Daher kann das Modell als Kernkomponente für Klassifikation in verschiedenen Bildverarbeitungs- und Computer-Vision-Problemen eingesetzt werden.

Ein hybrider Ansatz von Transformer und Sequencer für die Alters- und Geschlechtsklassifizierung aus wilden Gesichtsbildern | Neueste Forschungsarbeiten | HyperAI