vor 6 Monaten

Zusammenfassung

Interaktive Bildsegmentierung zeichnet sich durch Multimodalität aus. Wenn der Benutzer auf eine Tür klickt, möchte er dann die Tür oder das gesamte Haus auswählen? Wir präsentieren einen end-to-end-Lernansatz für interaktive Bildsegmentierung, der diese Mehrdeutigkeit angeht. Unsere Architektur verbindet zwei konvolutionale Netzwerke. Das erste wird darauf trainiert, eine Vielzahl plausibler Segmentierungen zu synthetisieren, die den Eingaben des Benutzers entsprechen. Das zweite Netzwerk wird darauf trainiert, unter diesen Lösungen auszuwählen. Durch die Auswahl einer einzigen Lösung behält unser Ansatz die Kompatibilität mit bestehenden interaktiven Segmentierungs-Schnittstellen bei. Durch die Synthese mehrerer unterschiedlicher Lösungen vor der Auswahl erhält die Architektur die repräsentative Kraft, den multimodalen Lösungsraum zu erkunden. Wir zeigen, dass der vorgeschlagene Ansatz bestehende Methoden für interaktive Bildsegmentierung übertrifft, einschließlich vorheriger Arbeiten, die konvolutionale Netzwerke auf dieses Problem angewendet haben, und gleichzeitig deutlich schneller ist.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Computer Vision

Semantische Segmentierung

Multimodal

Computervision

Aufgabe

Qifeng Chen Zhuwen Li Vladlen Koltun

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Computer Vision

Semantische Segmentierung

Multimodal

Computervision

Aufgabe

Qifeng Chen Zhuwen Li Vladlen Koltun

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Interaktive Bildsegmentierung mit latenter Vielfalt

Qifeng Chen Zhuwen Li Vladlen Koltun

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Interaktive Bildsegmentierung mit latenter Vielfalt

Qifeng Chen Zhuwen Li Vladlen Koltun

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Interaktive Bildsegmentierung mit latenter Vielfalt

Qifeng Chen Zhuwen Li Vladlen Koltun

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters