HyperAIHyperAI
vor 2 Monaten

Aufmerksamkeitsbasierte Ensemble für tiefes Metrik-Lernen

Wonsik Kim; Bhavya Goyal; Kunal Chawla; Jungmin Lee; Keunjoo Kwon
Aufmerksamkeitsbasierte Ensemble für tiefes Metrik-Lernen
Abstract

Tiefes Metrik-Lernen (deep metric learning) strebt danach, eine Einbettungsfunktion zu erlernen, die als tiefes neuronales Netz modelliert wird. Diese Einbettungsfunktion platziert in der gelernten Einbettungsraum-Struktur üblicherweise semantisch ähnliche Bilder nahe beieinander und dissimilare Bilder weit voneinander entfernt. Kürzlich wurde Ensemble-Lernen auf tiefes Metrik-Lernen angewendet, um Stand-der-Technik-Ergebnisse zu erzielen. Als ein wichtiger Aspekt des Ensembles sollten die Lernmodelle in ihren Merkmals-Einbettungen vielfältig sein. Zu diesem Zweck schlagen wir ein aufmerksamkeitsbasiertes Ensemble vor, das mehrere Aufmerksamkeitsmasken verwendet, sodass jedes Lernmodell sich auf unterschiedliche Teile des Objekts konzentrieren kann. Wir schlagen außerdem einen Divergenzverlust (divergence loss) vor, der Vielfalt unter den Lernmodellen fördert. Die vorgeschlagene Methode wurde auf Standard-Benchmarks für tiefes Metrik-Lernen angewendet, und experimentelle Ergebnisse zeigen, dass sie bei Bildretrieval-Aufgaben erheblich bessere Leistungen als die bisher besten Methoden erzielt.