HyperAIHyperAI
vor 2 Monaten

ReMix: Training Generalisierter Person-Reidentifikation auf einer Mischung von Daten

Mamedov, Timur ; Konushin, Anton ; Konushin, Vadim
ReMix: Training Generalisierter Person-Reidentifikation auf einer Mischung von Daten
Abstract

Moderne Methoden zur Personenerkennung (Re-ID) weisen eine schwache Generalisierungsfähigkeit auf und erleiden einen erheblichen Genauigkeitsverlust, wenn sich die Erfassungsumgebungen ändern. Dies liegt daran, dass existierende multikamera-Re-ID-Datensätze in ihrer Größe und Vielfalt begrenzt sind, da solche Daten schwer zu beschaffen sind. Gleichzeitig sind enorme Mengen an nicht gekennzeichneten Einzalkameras Aufzeichnungen verfügbar. Solche Daten können leicht gesammelt werden und sind daher vielfältiger. Derzeit wird Einzalkameras-Daten nur für das selbstüberwachte Vortrainieren von Re-ID-Methoden verwendet. Allerdings wird die Vielfalt der Einzalkameras-Daten durch das Feinjustieren auf begrenzte multikamera-Daten nach dem Vortrainieren unterdrückt. In dieser Arbeit schlagen wir ReMix vor, eine verallgemeinerte Re-ID-Methode, die gemeinsam auf einer Mischung aus begrenzten gekennzeichneten multikamera- und großen nicht gekennzeichneten Einzalkameras-Daten trainiert wird. Durch eine neuartige Datenauswahlstrategie und neu entwickelte Verlustfunktionen, die für den gemeinsamen Einsatz mit beiden Datentypen angepasst sind, gelingt es uns, unsere Methode effektiv zu trainieren. Experimente zeigen, dass ReMix eine hohe Generalisierungsfähigkeit besitzt und state-of-the-art-Methoden im verallgemeinerten Personenerkennungsproblem übertrifft. Nach bestem Wissen ist dies die erste Arbeit, die das gemeinsame Training auf einer Mischung aus multikamera- und Einzalkameras-Daten im Bereich der Personenerkennung untersucht.请注意,这里“Einzalkameras”是为了保持一致性而创造的一个复合词,通常在德语中会直接说“Einzelkamera”(单个摄像头)。为了更好地符合德语习惯,可以将“Einzalkameras”改为“Einzelkamera”。以下是调整后的版本:Moderne Methoden zur Personenerkennung (Re-ID) weisen eine schwache Generalisierungsfähigkeit auf und erleiden einen erheblichen Genauigkeitsverlust, wenn sich die Erfassungsumgebungen ändern. Dies liegt daran, dass existierende multikamera-Re-ID-Datensätze in ihrer Größe und Vielfalt begrenzt sind, da solche Daten schwer zu beschaffen sind. Gleichzeitig sind enorme Mengen an nicht gekennzeichneten Einzelkamera-Aufzeichnungen verfügbar. Solche Daten können leicht gesammelt werden und sind daher vielfältiger. Derzeit werden Einzelkamera-Daten nur für das selbstüberwachte Vortrainieren von Re-ID-Methoden verwendet. Allerdings wird die Vielfalt der Einzelkamera-Daten durch das Feinjustieren auf begrenzte multikamera-Daten nach dem Vortrainieren unterdrückt. In dieser Arbeit schlagen wir ReMix vor, eine verallgemeinerte Re-ID-Methode, die gemeinsam auf einer Mischung aus begrenzten gekennzeichneten multikamera- und großen nicht gekennzeichneten Einzelkamera-Daten trainiert wird. Durch eine neuartige Datenauswahlstrategie und neu entwickelte Verlustfunktionen, die für den gemeinsamen Einsatz mit beiden Datentypen angepasst sind, gelingt es uns, unsere Methode effektiv zu trainieren. Experimente zeigen, dass ReMix eine hohe Generalisierungsfähigkeit besitzt und state-of-the-art-Methoden im verallgemeinerten Personenerkennungsproblem übertrifft. Nach bestem Wissen ist dies die erste Arbeit, die das gemeinsame Training auf einer Mischung aus multikamera- und Einzelkamera-Daten im Bereich der Personenerkennung untersucht.

ReMix: Training Generalisierter Person-Reidentifikation auf einer Mischung von Daten | Neueste Forschungsarbeiten | HyperAI