HyperAIHyperAI

Command Palette

Search for a command to run...

Zentrierung und Skalierungsvorhersage: Ein anchorfreier Ansatz für die Erkennung von Personen und Gesichtern

Wei Liu extsuperscript1* Irtiza Hasan extsuperscript2* Shengcai Liao extsuperscript2**

Zusammenfassung

Objekterkennung erfordert traditionell rutschende Fenster-Klassifizierer oder in modernen Tiefenlernverfahren Vorhersagen auf Basis von Anchor Boxes. Jedoch benötigen beide Ansätze mühsame Konfigurationen der Boxen. In dieser Arbeit stellen wir eine neue Perspektive vor, bei der die Objekterkennung als eine Aufgabe zur Erkennung hochstufiger semantischer Merkmale motiviert wird. Ähnlich wie Kanten-, Ecken- und Blob-Detektoren durchsucht der vorgeschlagene Detektor das gesamte Bild nach Merkmalspunkten, wofür Faltung (Convolution) besonders geeignet ist. Im Gegensatz zu diesen traditionellen niedrigstufigen Merkmalen strebt der vorgeschlagene Detektor jedoch eine höhere Abstraktionsebene an, indem er nach Zentrumspunkten sucht, an denen sich Objekte befinden, und moderne Tiefenmodelle sind bereits in der Lage, solche hochstufige semantische Abstraktionen zu erkennen. Darüber hinaus prognostizieren wir ähnlich wie bei Blob-Detektion auch die Skalen der Zentrumspunkte, was ebenfalls eine einfache Faltung darstellt. Somit wird in dieser Arbeit die Erkennung von Fußgängern und Gesichtern durch konvolutive Voraussagen von Zentrum und Skala vereinfacht. Auf diese Weise verfügt die vorgeschlagene Methode über eine boxfreie Struktur. Trotz ihrer strukturellen Einfachheit zeigt sie wettbewerbsfähige Genauigkeit in mehreren anspruchsvollen Benchmarks, einschließlich der Erkennung von Fußgängern und Gesichtern. Des Weiteren wurde eine Kreuzdatensatzauswertung durchgeführt, die eine überlegene Generalisierungsfähigkeit der vorgeschlagenen Methode demonstriert. Der Code und die Modelle können unter den folgenden Links abgerufen werden: (https://github.com/liuwei16/CSP und https://github.com/hasanirtiza/Pedestron).


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp