HyperAIHyperAI

Command Palette

Search for a command to run...

SSD: Single Shot MultiBox Detector Übersetzung: SSD: Ein Schritt MultiBox-Detektor

Wei Liu Dragomir Anguelov Dumitru Erhan Christian Szegedy Scott Reed Cheng-Yang Fu Alexander C. Berg

Zusammenfassung

Wir stellen eine Methode zur Objekterkennung in Bildern vor, die ein einzelnes tiefes neuronales Netzwerk verwendet. Unser Ansatz, der SSD (Single Shot MultiBox Detector) genannt wird, diskretisiert den Ausgaberaum von Begrenzungsrahmen in eine Reihe von Standardboxen mit verschiedenen Seitenverhältnissen und Skalen pro Merkmalskartenposition. Bei der Vorhersage generiert das Netzwerk Bewertungen für die Anwesenheit jeder Objektkategorie in jeder Standardbox und erzeugt Anpassungen an der Box, um besser zur Objektform zu passen. Zudem kombiniert das Netzwerk Vorhersagen aus mehreren Merkmalskarten mit unterschiedlichen Auflösungen, um objekte verschiedener Größen natürlicher zu behandeln. Unser SSD-Modell ist im Vergleich zu Methoden, die Objektvorschläge benötigen, einfach, da es die Erstellung von Vorschlägen sowie nachfolgende Pixel- oder Merkmalsresampling-Stufen vollständig eliminiert und alle Berechnungen in einem einzigen Netzwerk kapselt. Dies macht SSD leichter zu trainieren und erleichtert die Integration in Systeme, die eine Detektionskomponente erfordern. Experimentelle Ergebnisse auf den Datensätzen PASCAL VOC, MS COCO und ILSVRC bestätigen, dass SSD vergleichbare Genauigkeit aufweist wie Methoden, die einen zusätzlichen Schritt zur Erstellung von Objektvorschlägen nutzen, und dabei viel schneller ist, während es einen vereinheitlichten Rahmen sowohl für das Training als auch für die Inferenz bietet. Im Vergleich zu anderen Einstufigen-Methoden erreicht SSD eine viel höhere Genauigkeit, selbst bei kleineren Eingabebildgrößen. Für eine Eingabegröße von 300×300300 \times 300300×300 erreicht SSD auf dem VOC2007-Testdatensatz eine mittlere Genauigkeit (mAP) von 72,1 % bei einer Geschwindigkeit von 58 FPS auf einem Nvidia Titan X. Für eine Eingabegröße von 500×500500 \times 500500×500 erreicht SSD eine mAP von 75,1 % und übertrifft damit ein vergleichbares state-of-the-art Modell des Typs Faster R-CNN. Der Quellcode ist unter https://github.com/weiliu89/caffe/tree/ssd verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp