HyperAIHyperAI
vor 2 Monaten

Schnelle, genaue und mehrskalige Inferenz für semantische Bildsegmentierung mit tiefen Gaußschen CRFs

Siddhartha Chandra; Iasonas Kokkinos
Schnelle, genaue und mehrskalige Inferenz für semantische Bildsegmentierung mit tiefen Gaußschen CRFs
Abstract

In dieser Arbeit schlagen wir eine strukturierte Vorhersagetechnik vor, die die Vorteile von Gaußschen bedingten Markov-Netzen (G-CRF) mit tiefem Lernen kombiniert: (a) unsere strukturierte Vorhersageaufgabe hat ein eindeutiges globales Optimum, das exakt aus der Lösung eines linearen Systems erhalten wird, (b) die Gradienten unserer Modellparameter werden analytisch mithilfe geschlossener Formeln berechnet, im Gegensatz zu den speicherintensiven modernen Ansätzen des tiefen strukturierten Lernens, die auf der Rückwärtspropagation durch die Zeit basieren, (c) unsere paarweisen Terme müssen nicht einfache handgefertigte Ausdrücke sein, wie in Arbeiten, die sich auf DenseCRF stützen, sondern können vielmehr durch tiefe Architekturen aus Daten "entdeckt" werden, und (d) unser System kann in einem end-to-end-Prozess trainiert werden. Indem wir uns auf standardisierte Werkzeuge der numerischen Analysis stützen, entwickeln wir sehr effiziente Algorithmen für Inferenz und Lernen sowie eine angepasste Technik für die semantische Segmentierung. Diese Effizienz ermöglicht es uns, komplexere Architekturen für strukturierte Vorhersagen im tiefen Lernen zu erforschen: Wir führen mehrskalige Architekturen ein, um Informationen über verschiedene Skalen in einem gemeinsamen Optimierungsrahmen zu verbinden, was systematische Verbesserungen bringt. Wir demonstrieren die Nützlichkeit unseres Ansatzes am anspruchsvollen Benchmark für Bildsegmentierung VOC PASCAL 2012 und zeigen erhebliche Verbesserungen gegenüber starken Baselines. Wir stellen unseren gesamten Code und alle Experimente unter {https://github.com/siddharthachandra/gcrf} zur Verfügung.

Schnelle, genaue und mehrskalige Inferenz für semantische Bildsegmentierung mit tiefen Gaußschen CRFs | Forschungsarbeiten | HyperAI