HyperAIHyperAI

Command Palette

Search for a command to run...

Kollaborative Videoobjektsegmentierung durch Mehrskalen-Vordergrund-Hintergrund-Integration

Zongxin Yang; Yunchao Wei; Yi Yang

Zusammenfassung

Dieses Papier untersucht die Prinzipien des Einbettungslernens zur Bewältigung der anspruchsvollen Aufgabe der halbüberwachten VideoobjektsSegmentierung. Im Gegensatz zu früheren Ansätzen, die sich auf das Einbettungslernen von Vordergrundobjekt(en) konzentrieren, betrachten wir, dass der Hintergrund gleichwertig behandelt werden sollte. Daher schlagen wir einen Ansatz zur kollaborativen Videoobjektssegmentierung durch Integration von Vorder- und Hintergrund (CFBI) vor. CFBI trennt die MerkmalsEinbettung in den Bereich des Vordergrundobjekts und den entsprechenden Hintergrundbereich, was implizit dazu führt, dass sie kontrastreicher werden und die Segmentierungsergebnisse entsprechend verbessert. Darüber hinaus führt CFBI sowohl Pixel-Level-Matching-Prozesse als auch Instanz-Level-Aufmerksamkeitsmechanismen zwischen dem Referenzbild und der vorhergesagten Sequenz durch, wodurch CFBI robust gegenüber verschiedenen Objektgrößen wird. Auf Basis von CFBI stellen wir eine mehrskalige Matchingstruktur vor und schlagen eine dilatierte Matching-Strategie (Atrous Matching) vor, was zu einem robusteren und effizienteren Framework, CFBI+, führt. Wir führen umfangreiche Experimente auf zwei gängigen Benchmarks durch, nämlich DAVIS und YouTube-VOS. Ohne Anwendung von simulierten Daten für das Vortraining erreicht unser CFBI+ eine Leistung (J&F) von 82,9 % und 82,8 %, was alle anderen Standderverfahren übertrifft. Code: https://github.com/z-x-yang/CFBI.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Kollaborative Videoobjektsegmentierung durch Mehrskalen-Vordergrund-Hintergrund-Integration | Paper | HyperAI