HyperAIHyperAI
vor 2 Monaten

Label-Decoupling-Rahmenwerk für die Erkennung von auffälligen Objekten

Jun Wei; Shuhui Wang; Zhe Wu; Chi Su; Qingming Huang; Qi Tian
Label-Decoupling-Rahmenwerk für die Erkennung von auffälligen Objekten
Abstract

Um genauere Salienzkarten zu erzielen, konzentrieren sich aktuelle Methoden hauptsächlich auf die Aggregation von mehrstufigen Merkmalen aus vollständig konvolutionalen Netzen (FCN) und die Einführung von Kantendaten als zusätzliche Überwachung. Obwohl bemerkenswerte Fortschritte gemacht wurden, beobachten wir, dass je näher ein Pixel an der Kante liegt, desto schwieriger ist es vorherzusagen, da Kantenpixel eine sehr ungleichmäßige Verteilung haben. Um dieses Problem zu lösen, schlagen wir einen Label-Decoupling-Framework (LDF) vor, das aus einem Label-Decoupling-Verfahren (LD) und einem Feature-Interaction-Netzwerk (FIN) besteht. LD zerlegt die ursprüngliche Salienzkarte explizit in eine Body-Karte und eine Detail-Karte, wobei die Body-Karte sich auf die Zentrumsbereiche der Objekte konzentriert und die Detail-Karte sich auf Bereiche um die Kanten fokussiert. Die Detail-Karte funktioniert besser, da sie viel mehr Pixel als traditionelle Kantenerkennung umfasst. Im Gegensatz zur Salienzkarte ignoriert die Body-Karte Kantenpixel und konzentriert sich ausschließlich auf Zentrumsbereiche. Dies vermeidet erfolgreich Ablenkungen durch Kantenpixel während des Trainings. Daher verwenden wir in FIN zwei Zweige, um jeweils Body-Karte und Detail-Karte zu bearbeiten. Die Feature-Interaktion (FI) ist darauf ausgelegt, die beiden komplementären Zweige zu fusionieren, um die Salienzkarte vorherzusagen, welche dann wiederum verwendet wird, um die beiden Zweige weiter zu verfeinern. Diese iterative Verfeinerung ist hilfreich für das Erlernen besserer Repräsentationen und präziserer Salienzkarten. Ausführliche Experimente auf sechs Benchmark-Datensätzen zeigen, dass LDF verschiedene Evaluationsmetriken gegenüber den besten bisherigen Ansätzen übertrifft.