HyperAIHyperAI

Command Palette

Search for a command to run...

NODIS: Neural Ordinary Differential Scene Understanding

Cong Yuren Hanno Ackermann Wentong Liao Michael Ying Yang Bodo Rosenhahn

Zusammenfassung

Semantische Bildverstehens ist eine herausfordernde Aufgabe im Bereich der Computer Vision. Es erfordert nicht nur die Detektion aller Objekte in einem Bild, sondern auch die Identifizierung aller Beziehungen zwischen diesen Objekten. Die detektierten Objekte, ihre Labels sowie die entdeckten Beziehungen können verwendet werden, um einen Szenengraphen zu konstruieren, der eine abstrakte semantische Interpretation des Bildes bereitstellt. In früheren Arbeiten wurden Beziehungen durch die Lösung eines Zuordnungsproblems identifiziert, das als gemischt-ganzzahliges lineares Programm formuliert wurde. In dieser Arbeit deuten wir diese Formulierung als gewöhnliche Differentialgleichung (ODE) auf. Der vorgeschlagene Architekturansatz führt die Szenengraphen-Inferenz durch die Lösung einer neuronalen Variante einer ODE mittels end-to-end Lernverfahren durch. Die Methode erreicht state-of-the-art Ergebnisse auf allen drei Benchmark-Aufgaben: Szenengraphen-Generierung (SGGen), Klassifikation (SGCls) und visuelle Beziehungserkennung (PredCls) auf dem Visual Genome Benchmark.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp