vor 6 Monaten

Zusammenfassung

Die semantische Szenenkompletierung (Semantic Scene Completion, SSC) ist eine herausfordernde Aufgabe im Bereich des Computer Vision mit zahlreichen praktischen Anwendungen, etwa in der Robotik oder assistiven Computing. Ihr Ziel besteht darin, die 3D-Geometrie eines Sichtfelds einer Szene sowie die semantischen Bezeichnungen der Voxel – einschließlich verdeckter Bereiche – abzuleiten. In dieser Arbeit präsentieren wir SPAwN, ein neuartiges, leichtgewichtiges multimodales 3D-Deep-CNN, das strukturelle Informationen aus der Tiefenkomponente von RGB-D-Bildern nahtlos mit semantischen Priorwissen aus einem bimodalen 2D-Segmentierungssystem fusioniert. Ein entscheidendes Hindernis in diesem Forschungsfeld ist das Fehlen vollständig annotierter, realweltbasierter 3D-Datensätze, die groß genug sind, um die aktuellen datenhungrigen tiefen 3D-CNNs zu trainieren. In 2D-Computer-Vision-Aufgaben wurden zahlreiche Daten-Augmentierungsstrategien vorgeschlagen, um die Generalisierungsfähigkeit von CNNs zu verbessern. Diese Ansätze können jedoch nicht direkt auf die RGB-D-Eingabe- und Ausgabevolumina von SSC-Lösungen angewendet werden. In diesem Paper führen wir eine 3D-Daten-Augmentierungsstrategie ein, die auf multimodale SSC-Netzwerke anwendbar ist. Wir validieren unsere Beiträge durch eine umfassende und reproduzierbare Ablationstudie. Unser Ansatz übertrifft konsistent frühere Arbeiten mit vergleichbarer Komplexität.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Multimodal

Semantische Segmentierung

Faltungsneuronales Netzwerk

Aloisio Dourado Frederico Guth Teofilo de Campos

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Multimodal

Semantische Segmentierung

Faltungsneuronales Netzwerk

Aloisio Dourado Frederico Guth Teofilo de Campos

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Datenverstärkte 3D semantische Szenenkompletierung mit 2D Segmentierungsprioritäten | Paper | HyperAI

Command Palette

Datenverstärkte 3D semantische Szenenkompletierung mit 2D Segmentierungsprioritäten

Aloisio Dourado Frederico Guth Teofilo de Campos

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Datenverstärkte 3D semantische Szenenkompletierung mit 2D Segmentierungsprioritäten

Aloisio Dourado Frederico Guth Teofilo de Campos

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Datenverstärkte 3D semantische Szenenkompletierung mit 2D Segmentierungsprioritäten

Aloisio Dourado Frederico Guth Teofilo de Campos

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters