DynaSeg: Eine tiefe dynamische Fusionsmethode für die unüberwachte Bildsegmentierung, die Merkmalsähnlichkeit und räumliche Kontinuität einbezieht

Unsere Arbeit befasst sich mit der grundlegenden Herausforderung der Bildsegmentierung in der Computer Vision, die für vielfältige Anwendungen von entscheidender Bedeutung ist. Obwohl überwachte Methoden Kompetenz zeigen, limitiert ihre Abhängigkeit von umfangreichen Pixel-Level-Annotierungen die Skalierbarkeit. Wir stellen DynaSeg vor, einen innovativen Ansatz zur unüberwachten Bildsegmentierung, der es schafft, das Gleichgewicht zwischen Merkmalsähnlichkeit und räumlicher Kontinuität herzustellen, ohne auf umfangreiche Hyperparameter-Tuning angewiesen zu sein. Im Gegensatz zu traditionellen Methoden verwendet DynaSeg ein dynamisches Gewichtungsverfahren, das den Parameter-Tuning automatisiert, sich flexibel an die Bildmerkmale anpasst und eine einfache Integration in andere Segmentierungsnetze ermöglicht. Durch die Einbeziehung einer Silhouette-Score-Phase verhindert DynaSeg Untersegmentierungsfehler, bei denen die Anzahl der vorhergesagten Cluster auf einen konvergieren könnte. DynaSeg nutzt eine CNN-basierte und vortrainierte ResNet-Feature-Extraktion, was es rechnerisch effizienter und einfacher als andere komplexe Modelle macht. Experimentelle Ergebnisse zeigen eine Spitzenleistung: DynaSeg erreicht eine Verbesserung des mIOU um 12,2 % und 14,12 % im Vergleich zu aktuellen unüberwachten Segmentierungsansätzen auf den COCO-All und COCO-Stuff Datensätzen. Wir präsentieren qualitative und quantitative Ergebnisse auf fünf Benchmark-Datensätzen, die die Effektivität des vorgeschlagenen Ansatzes unterstreichen. Der Quellcode ist unter https://github.com/RyersonMultimediaLab/DynaSeg verfügbar.