vor 8 Monaten

Zusammenfassung

Die sichtbare (VIS) bis zur nahen Infrarot- (NIR) Bereichs-Gesichtserkennung ist ein herausforderndes Problem aufgrund der erheblichen Domänenunterschiede zwischen den Bereichen und des Mangels an ausreichenden Daten für das Training von cross-modalen Matching-Algorithmen. Bestehende Ansätze versuchen, dieses Problem durch die Synthese von sichtbaren Gesichtern aus NIR-Gesichtern, das Extrahieren domäneninvarianter Merkmale aus diesen Modalitäten oder das Projektieren heterogener Daten in einen gemeinsamen latenten Raum für cross-modales Matching zu lösen. In dieser Arbeit beschreiben wir einen anderen Ansatz, bei dem wir die Entwirrte Variationsdarstellung (Disentangled Variational Representation, DVR) für cross-modales Matching nutzen.Zunächst modellieren wir eine Gesichtsdarstellung mit intrinsischer Identitätsinformation und deren innerpersonellen Variationen. Durch die Untersuchung des entwirrten latenten Variablenraums wird eine variationsmäßige untere Schranke verwendet, um die approximierte A-posteriori-Verteilung für NIR- und VIS-Darstellungen zu optimieren. Zweitens zielen wir darauf ab, einen kompakteren und diskriminativeren entwirrten latenten Raum zu erhalten. Dazu legen wir eine Minimierung der Identitätsinformation für denselben Subjekt fest und führen eine gelockerte Korrelationsanpassungsbedingung zwischen den Modulationsvariationen von NIR und VIS ein.Es wird ein alternativer Optimierungsalgorithmus vorgeschlagen, der sowohl die Entwirrte Variationsdarstellung als auch das heterogene Gesichtserkennungsnetzwerk berücksichtigt. Die gegenseitige Förderung dieser beiden Teile reduziert effektiv die Domänenunterschiede zwischen NIR und VIS und mildert Overfitting. Ausführliche Experimente auf drei anspruchsvollen NIR-VIS heterogenen Gesichtserkennungsdatensätzen zeigen, dass das vorgeschlagene Verfahren erhebliche Verbesserungen gegenüber den Stand-of-the-Art-Methoden erreicht.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Computer Vision

Gesichtserkennung

Multimodale Darstellung

Multimodal

Computervision

Aufgabe

Xiang Wu Huaibo Huang Vishal M. Patel Ran He Zhenan Sun

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Computer Vision

Gesichtserkennung

Multimodale Darstellung

Multimodal

Computervision

Aufgabe

Xiang Wu Huaibo Huang Vishal M. Patel Ran He Zhenan Sun

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Entwirrte variationsbasierte Darstellung für heterogene Gesichtserkennung

Xiang Wu Huaibo Huang Vishal M. Patel Ran He Zhenan Sun

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Entwirrte variationsbasierte Darstellung für heterogene Gesichtserkennung

Xiang Wu Huaibo Huang Vishal M. Patel Ran He Zhenan Sun

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Entwirrte variationsbasierte Darstellung für heterogene Gesichtserkennung

Xiang Wu Huaibo Huang Vishal M. Patel Ran He Zhenan Sun

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters