Qualitätsbewusstes Netzwerk für die Erkennung von Mengen zu Mengen

Dieses Papier behandelt das Problem der Mengen-zu-Mengenerkennung, bei dem das Metrik zwischen zwei Bildmengen gelernt wird. Die Bilder in jeder Menge gehören zur gleichen Identität. Da die Bilder in einer Menge ergänzend sein können, erhofft man sich in praktischen Anwendungen eine höhere Genauigkeit. Allerdings kann die Qualität jedes einzelnen Beispiels nicht garantiert werden, und Beispiele von schlechter Qualität werden die Metrik beeinträchtigen. In diesem Artikel wird das Qualitätsbewusste Netzwerk (QAN) vorgeschlagen, um dieses Problem anzugehen. Dabei kann die Qualität jedes Beispiels automatisch gelernt werden, obwohl diese Informationen im Trainingsstadium nicht explizit bereitgestellt werden. Das Netzwerk besteht aus zwei Zweigen: Der erste Zweig extrahiert ein Erscheinungsmerkmals-Embedding für jedes Beispiel, während der andere Zweig eine Qualitätsbewertung für jedes Beispiel vorhersagt. Die Merkmale und Qualitätsbewertungen aller Beispiele in einer Menge werden dann aggregiert, um das endgültige Feature-Embedding zu generieren. Wir zeigen, dass die beiden Zweige unter Verwendung nur der mengenbezogenen Identitätsannotierung auf end-to-end-Basis trainiert werden können. Eine Analyse des Gradientenspreads dieses Mechanismus zeigt, dass die durch das Netzwerk gelernte Qualität für die Mengen-zu-Mengenerkennung vorteilhaft ist und die Verteilung vereinfacht, der das Netzwerk angepasst werden muss. Experimente sowohl bei der Gesichtserkennung als auch bei der Person-Wiedererkennung verdeutlichen die Vorteile des vorgeschlagenen QAN. Der Quellcode und die Netzwerkkonfiguration können unter https://github.com/sciencefans/Quality-Aware-Network heruntergeladen werden.请注意,"end-to-end" 是一个在科技领域常用的术语,通常直接保留为 "end-to-end" 或者翻译为 "von Anfang bis Ende". 在这里我选择了前者以保持专业性。