HyperAIHyperAI

Command Palette

Search for a command to run...

DiffusionInst: Diffusion-Modell für die Instanzsegmentierung

Zhangxuan Gu Haoxing Chen Zhuoer Xu Jun Lan Changhua Meng Weiqiang Wang

Zusammenfassung

Diffusionsframeworks haben eine vergleichbare Leistungsfähigkeit mit früheren state-of-the-art-Bildgenerationsmodellen erreicht. Aufgrund ihres leistungsfähigen Rausch-zu-Bild-Entrauschungspipelines sind Forscher an Varianten dieser Ansätze für diskriminative Aufgaben interessiert. In dieser Arbeit wird DiffusionInst vorgestellt, ein neuartiges Framework, das Instanzen als instanzbewusste Filter darstellt und die Instanzsegmentierung als einen Rausch-zu-Filter-Entrauschungsprozess formuliert. Das Modell wird trainiert, die verrauschten Groundtruth-Daten ohne jeglichen induktiven Bias aus einem RPN umzukehren. Während der Inferenz nimmt es einen zufällig generierten Filter als Eingabe entgegen und erzeugt im einen Schritt oder in mehreren Schritten die Maske. Ausführliche experimentelle Ergebnisse auf COCO und LVIS zeigen, dass DiffusionInst gegenüber bestehenden Instanzsegmentierungsmodellen mit verschiedenen Backbone-Architekturen – wie ResNet und Swin-Transformer – konkurrenzfähige Leistung erzielt. Wir hoffen, dass unsere Arbeit als eine starke Baseline dienen kann, die die Entwicklung effizienterer Diffusionsframeworks für anspruchsvolle diskriminative Aufgaben anregen wird. Der Quellcode ist unter https://github.com/chenhaoxing/DiffusionInst verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp