HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Lernen effizienter Ein-Stufen-Personenerkennungssysteme durch asymptotische Lokalisierungsanpassung

{Xuezhi Liang Shengcai Liao Weidong Hu Wei Liu Xiao Chen}

Lernen effizienter Ein-Stufen-Personenerkennungssysteme durch asymptotische Lokalisierungsanpassung

Abstract

Obwohl zwei-stufige Detektoren auf Basis von Faster R-CNN erhebliche Fortschritte bei der Genauigkeit der Personenerkennung erzielt haben, sind sie weiterhin zu langsam für praktische Anwendungen. Eine mögliche Lösung besteht darin, diesen Arbeitsablauf zu vereinfachen und als einstufige Detektion zu implementieren. Allerdings haben derzeitige einstufige Detektoren (z. B. SSD) auf gängigen Benchmarks für Personenerkennung keine konkurrenzfähige Genauigkeit erreicht. In dieser Arbeit wird ein erfolgreicher Personen-Detektor angestrebt, der die Geschwindigkeit von SSD beibehält, gleichzeitig aber die Genauigkeit von Faster R-CNN erreicht. Konkret wird ein strukturell einfaches, jedoch wirksames Modul namens Asymptotic Localization Fitting (ALF) vorgeschlagen, das eine Reihe von Vorhersagern verwendet, um die vorgegebenen Anchor-Boxen von SSD schrittweise direkt in verbesserte Detektionsergebnisse zu transformieren. Dadurch profitieren während des Trainings die nachfolgenden Vorhersager von mehr und höherwertigen positiven Beispielen, während zugleich immer anspruchsvollere negative Beispiele mit steigenden IoU-Schwellenwerten identifiziert werden können. Auf dieser Grundlage wird eine effiziente einstufige Architektur für die Personenerkennung (bezeichnet als ALFNet) entworfen, die eine state-of-the-art Leistung auf den beiden größten Benchmarks für Personenerkennung, CityPersons und Caltech, erzielt und somit einen äußerst attraktiven Detektor sowohl hinsichtlich Genauigkeit als auch Geschwindigkeit darstellt. Der Quellcode ist verfügbar unter: \href{https://github.com/VideoObjectSearch/ALFNet}{https://github.com/VideoObjectSearch/ALFNet}.

Benchmarks

BenchmarkMethodikMetriken
pedestrian-detection-on-caltechALFNet
Reasonable Miss Rate: 6.1
pedestrian-detection-on-caltechALFNet + CityPersons dataset
Reasonable Miss Rate: 4.5
pedestrian-detection-on-citypersonsALFNet
Bare MR^-2: 8.4
Heavy MR^-2: 51.9
Large MR^-2: 6.6
Medium MR^-2: 5.7
Partial MR^-2: 11.4
Reasonable MR^-2: 12.0
Small MR^-2: 19.0
Test Time: 0.27

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp