vor 8 Monaten

Zusammenfassung

Wir präsentieren DFormer, ein neues Vortrainingsframework für RGB-D-Aufgaben, das übertragbare Repräsentationen für die Segmentierung von RGB-D-Bildern lernt. DFormer verfügt über zwei wesentliche Innovationen: 1) Im Gegensatz zu früheren Arbeiten, die RGB-D-Information mit einem auf RGB vortrainierten Backbone kodieren, verwenden wir Bild-Tiefen-Paare aus ImageNet-1K zur Vortrainung des Backbones. Dadurch wird DFormer mit der Fähigkeit ausgestattet, RGB-D-Repräsentationen zu kodieren; 2) DFormer besteht aus einer Reihe von RGB-D-Blöcken, die durch eine neuartige Bauelementdesign speziell für die Kodierung von sowohl RGB- als auch Tiefeninformationen angepasst sind. DFormer vermeidet die fehlerhafte Kodierung der 3D-Geometriebeziehungen in Tiefenkarten, die bei den existierenden Methoden häufig auftritt, aber bisher nicht gelöst wurde. Wir feinjustieren das vortrainierte DFormer an zwei gängigen RGB-D-Aufgaben, nämlich der semantischen Segmentierung von RGB-D-Bildern und der Detektion hervorstechender Objekte in RGB-D-Bildern, unter Verwendung eines leichten Decoder-Kopfes. Experimentelle Ergebnisse zeigen, dass unser DFormer bei diesen beiden Aufgaben eine neue Spitzenleistung erzielt und dabei weniger als die Hälfte der Rechenkosten des aktuellen besten Verfahrens auf zwei RGB-D-Semantiksegmentierungsdatensätzen und fünf RGB-D-Hervorstechendobjektdetektionsdatensätzen benötigt. Unser Code ist unter folgender URL verfügbar: https://github.com/VCIP-RGBD/DFormer.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Semantische Segmentierung

Multimodale Darstellung

Bowen Yin¹ Xuying Zhang¹ Zhongyu Li¹ Li Liu² Ming-Ming Cheng¹ Qibin Hou¹∗

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Semantische Segmentierung

Multimodale Darstellung

Bowen Yin¹ Xuying Zhang¹ Zhongyu Li¹ Li Liu² Ming-Ming Cheng¹ Qibin Hou¹∗

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

DFormer: Neuaufnahme des RGBD-Darstellungslernens für die semantische Segmentierung | Paper | HyperAI

Command Palette

DFormer: Neuaufnahme des RGBD-Darstellungslernens für die semantische Segmentierung

Bowen Yin¹ Xuying Zhang¹ Zhongyu Li¹ Li Liu² Ming-Ming Cheng¹ Qibin Hou¹∗

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DFormer: Neuaufnahme des RGBD-Darstellungslernens für die semantische Segmentierung

Bowen Yin¹ Xuying Zhang¹ Zhongyu Li¹ Li Liu² Ming-Ming Cheng¹ Qibin Hou¹∗

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DFormer: Neuaufnahme des RGBD-Darstellungslernens für die semantische Segmentierung

Bowen Yin¹ Xuying Zhang¹ Zhongyu Li¹ Li Liu² Ming-Ming Cheng¹ Qibin Hou¹∗

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters