QuantFace: Auf dem Weg zu leichtgewichtiger Gesichtserkennung durch synthetische Daten Niedrigbits Quantisierung

Tiefen Lern-basierte Gesichtserkennungsmodelle folgen dem üblichen Trend in tiefen neuronalen Netzen, indem sie vollpräzise Fließkomma-Netze mit hohen Rechenkosten verwenden. Die Bereitstellung solcher Netze in Anwendungsfällen, die durch rechnerische Anforderungen eingeschränkt sind, ist oft aufgrund des großen Speichers, der vom vollpräzisen Modell benötigt wird, nicht praktikabel. Frühere Ansätze zur kompakten Gesichtserkennung schlugen vor, spezielle kompakte Architekturen zu entwerfen und diese von Grund auf mit echten Trainingsdaten zu trainieren, was in realen Szenarien aufgrund von Datenschutzbedenken möglicherweise nicht möglich ist. In dieser Arbeit stellen wir die QuantFace-Lösung vor, die auf der Quantisierung von Modellen mit niedriger Bitpräzision basiert. QuantFace reduziert die erforderlichen Rechenkosten bestehender Gesichtserkennungsmodelle ohne den Bedarf einer speziellen Architektur oder den Zugriff auf echte Trainingsdaten. QuantFace führt datenschutzfreundliche synthetische Gesichtsdaten in den Quantisierungsprozess ein, um potentielle Datenschutzbedenken und Probleme bezüglich des Zugangs zu echten Trainingsdaten abzumildern. Durch umfangreiche Evaluationsversuche an sieben Benchmarks und vier Netzarchitekturen zeigen wir, dass QuantFace das Modellvolumen bis zu 5-fach reduzieren kann, während es gleichzeitig weitgehend die Verifizierungsleistung des vollpräzisen Modells beibehält, ohne auf echte Trainingsdatensätze zugreifen zu müssen.