vor 8 Monaten

Zusammenfassung

Das Erkennen von Alter und Geschlecht unter realen Bedingungen ist eine äußerst herausfordernde Aufgabe: Neben der Variabilität der Bedingungen, der Komplexität der Haltungen und der unterschiedlichen Bildqualität gibt es Fälle, in denen das Gesicht teilweise oder vollständig verdeckt ist. Wir stellen MiVOLO (Multi Input VOLO) vor, einen einfachen Ansatz zur Schätzung von Alter und Geschlecht unter Verwendung des neuesten Vision-Transformers. Unsere Methode integriert beide Aufgaben in ein vereintes Modell mit doppelter Eingabe/Ausgabe, das nicht nur gesichtsbasierte Informationen, sondern auch Daten von Personenaufnahmen nutzt. Dies verbessert die Generalisierungsfähigkeit unseres Modells und ermöglicht es, zufriedenstellende Ergebnisse zu liefern, selbst wenn das Gesicht im Bild nicht sichtbar ist. Um unser vorgeschlagenes Modell zu evaluieren, führen wir Experimente auf vier gängigen Benchmarks durch und erzielen dabei den aktuellen Stand der Technik (state-of-the-art performance), während wir gleichzeitig die Fähigkeit zur Echtzeitverarbeitung nachweisen.Zusätzlich führen wir einen neuen Benchmark ein, der auf Bildern aus dem Open Images Dataset basiert. Die Ground-Truth-Annotierungen für diesen Benchmark wurden sorgfältig von menschlichen Annotierern generiert, was durch eine intelligente Aggregation der Stimmen zu hochgenauen Antworten führt. Des Weiteren vergleichen wir die Alterserkennungsleistung unseres Modells mit menschlicher Genauigkeit und zeigen, dass es in den meisten Altersgruppen erheblich besser abschneidet als Menschen. Schließlich gewähren wir öffentlichen Zugang zu unseren Modellen sowie zum Validierungs- und Inferenzcode. Zudem stellen wir zusätzliche Annotierungen für verwendete Datensätze bereit und führen unseren neuen Benchmark ein.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Kuprashevich Maksim ; Tolstykh Irina

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Kuprashevich Maksim ; Tolstykh Irina

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

MiVOLO: Mehrfacheingabetransformer für Alters- und Geschlechtsbestimmung | Paper | HyperAI

Command Palette

MiVOLO: Mehrfacheingabetransformer für Alters- und Geschlechtsbestimmung

Kuprashevich Maksim ; Tolstykh Irina

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MiVOLO: Mehrfacheingabetransformer für Alters- und Geschlechtsbestimmung

Kuprashevich Maksim ; Tolstykh Irina

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MiVOLO: Mehrfacheingabetransformer für Alters- und Geschlechtsbestimmung

Kuprashevich Maksim ; Tolstykh Irina

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters