HyperAIHyperAI

Command Palette

Search for a command to run...

SegBlocks: blockbasierte dynamische Auflösungsnetzwerke für Echtzeit-Segmentation

Thomas Verelst Tinne Tuytelaars

Zusammenfassung

SegBlocks reduziert die Rechenkosten bestehender neuronaler Netzwerke, indem die Verarbeitungsauflösung von Bildregionen dynamisch an deren Komplexität angepasst wird. Unsere Methode teilt ein Bild in Blöcke auf und unterschreibt Blöcke geringer Komplexität, wodurch die Anzahl der Operationen und der Speicherverbrauch verringert wird. Ein leichtgewichtiges Policy-Netzwerk, das komplexe Regionen auswählt, wird mittels Verstärkungslernen trainiert. Zudem führen wir mehrere in CUDA implementierte Module ein, um Bilder blockweise zu verarbeiten. Vor allem wichtig ist unser neuartiges BlockPad-Modul, das die Merkmalsdiskontinuitäten an Blockgrenzen vermeidet, an denen bestehende Methoden leiden, gleichzeitig jedoch den Speicherverbrauch unter Kontrolle hält. Unsere Experimente auf den Datensätzen Cityscapes, CamVid und Mapillary Vistas für die semantische Segmentierung zeigen, dass die dynamische Bildverarbeitung im Vergleich zu statischen Baselines ähnlicher Komplexität ein besseres Verhältnis zwischen Genauigkeit und Komplexität ermöglicht. Beispielsweise senkt unsere Methode die Anzahl der Fließkomma-Operationen von SwiftNet-RN18 um 60 % und erhöht die Inferenzgeschwindigkeit um 50 %, wobei die mIoU-Genauigkeit auf Cityscapes nur um 0,3 % abnimmt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
SegBlocks: blockbasierte dynamische Auflösungsnetzwerke für Echtzeit-Segmentation | Paper | HyperAI