Objekterkennung mit Tarnung und Ablenkungsanalyse

Die Tarnobjekt-Segmentierung (COS) zielt darauf ab, Objekte zu identifizieren, die sich "vollständig" in ihre Umgebung einfügen, was eine breite Palette wertvoller Anwendungen ermöglicht. Die Hauptausforderung bei der COS besteht darin, dass zwischen den potenziellen Objekten und dem Rauschhintergrund hohe inhärente Ähnlichkeiten bestehen. In dieser Arbeit bemühen wir uns, den Herausforderungen einer effektiven und effizienten COS gerecht zu werden. Zu diesem Zweck entwickeln wir ein biologisch inspiriertes Framework, das als Positionierungs- und Fokussierungsnetzwerk (PFNet) bezeichnet wird und den Jagdprozess in der Natur nachahmt. Insbesondere enthält unser PFNet zwei zentrale Module, nämlich das Positionierungsmodul (PM) und das Fokussierungsmodul (FM). Das PM ist so konzipiert, dass es den Detektionsprozess in der Jagd nachbildet, um potenzielle Zielobjekte aus einer globalen Perspektive zu positionieren. Das FM wird dann verwendet, um den Identifikationsprozess in der Jagd nachzubilden und die grobe Vorhersage durch Fokussierung auf die unklaren Bereiche schrittweise zu verfeinern. Bemerkenswerterweise haben wir im FM eine neuartige Ablenkungsminierungstrategie entwickelt, die die Entdeckung und Beseitigung von Ablenkungen unterstützt und somit die Leistungsfähigkeit der Schätzungen verbessert. Ausführliche Experimente zeigen, dass unser PFNet in Echtzeit läuft (72 FPS) und unter vier Standardmetriken auf drei anspruchsvollen Datensätzen erheblich 18 state-of-the-art Modelle übertrifft.