HyperAIHyperAI
vor 15 Tagen

Deep Miner: Ein tiefes und mehrästiges Netzwerk, das reiche und vielfältige Merkmale für die Personenwiedererkennung extrahiert

Abdallah Benzine, Mohamed El Amine Seddik, Julien Desmarais
Deep Miner: Ein tiefes und mehrästiges Netzwerk, das reiche und vielfältige Merkmale für die Personenwiedererkennung extrahiert
Abstract

Die meisten aktuellen Ansätze zur Personen-Identifizierung (person re-identification) basieren auf tiefen konvolutionellen neuronalen Netzwerken (CNNs). Obwohl diese Netzwerke in mehreren Aufgaben wie Klassifikation oder Objekterkennung wirksam sind, neigen sie dazu, sich auf die diskriminativsten Teile eines Objekts zu konzentrieren, anstatt alle relevanten Merkmale zu erfassen. Dieses Verhalten beeinträchtigt die Leistungsfähigkeit eines CNNs bei der Personen-Identifizierung, da hier eine Identifizierung vielfältiger und fein abgestufter Merkmale erforderlich ist. Es ist daher entscheidend, das Netzwerk dazu zu bringen, eine große Vielfalt feiner Merkmale zu lernen, um den Identifizierungsprozess zuverlässig und robust gegenüber feinen Veränderungen zu gestalten. In diesem Artikel stellen wir Deep Miner vor, eine Methode, die es CNNs ermöglicht, reichhaltigere und vielfältigere Merkmale von Personen für deren Identifizierung „zu extrahieren“. Deep Miner besteht speziell aus drei Arten von Verzweigungen: einer Globalen Verzweigung (G-Verzweigung), einer Lokalen Verzweigung (L-Verzweigung) und einer Eingabe-Unterdrückten Verzweigung (IE-Verzweigung). Die G-Verzweigung entspricht dem ursprünglichen Backbone-Netzwerk und prognostiziert globale Merkmale, während die L-Verzweigung Merkmale auf Teil-Ebene ermittelt. Die IE-Verzweigung erhält dagegen teilweise unterdrückte Merkmalskarten als Eingabe, wodurch das Netzwerk in der Lage ist, neue Merkmale (die von der G-Verzweigung übersehen wurden) als Ausgabe zu generieren. Um diesen speziellen Zweck zu erreichen, wird ein maßgeschneidertes Unterdrückungsverfahren eingeführt, das dazu dient, Merkmale innerhalb eines gegebenen CNNs zu identifizieren und zu entfernen. Dieses Unterdrückungsverfahren zeichnet sich durch seine Einfachheit aus und führt gleichzeitig zu einem Modell, das die Leistungsfähigkeit von State-of-the-Art (SOTA)-Methoden für die Personen-Identifizierung erheblich übertrifft. Insbesondere führen wir Experimente an vier etablierten Benchmarks für die Personen-Identifizierung durch und beobachten gegenüber SOTA-Methoden eine absolute Steigerung der Leistung um bis zu 6,5 % mAP.

Deep Miner: Ein tiefes und mehrästiges Netzwerk, das reiche und vielfältige Merkmale für die Personenwiedererkennung extrahiert | Neueste Forschungsarbeiten | HyperAI