Verbesserte Techniken für die schwach überwachte Objektlokalisation

Wir schlagen eine verbesserte Technik für schwach überwachte Objektlokalisation vor. Herkömmliche Methoden haben die Einschränkung, dass sie sich nur auf die am stärksten unterscheidbaren Teile der Zielobjekte konzentrieren. Eine jüngste Studie hat dieses Problem angegangen und diese Einschränkung durch die Erweiterung der Trainingsdaten für weniger unterscheidbare Teile beseitigt. Zu diesem Zweck setzen wir eine effektive Datenverstärkung ein, um die Genauigkeit der Objektlokalisation zu verbessern. Darüber hinaus führen wir verbesserte Lernverfahren ein, indem wir Faltungsneuronale Netze (CNN) basierend auf dem aktuellen Stand der Technik optimieren. Anhand umfangreicher Experimente bewerten wir die Effektivität des vorgeschlagenen Ansatzes sowohl qualitativ als auch quantitativ. Insbesondere beobachten wir, dass unsere Methode die Top-1-Lokalisationsgenauigkeit um 21,4 - 37,3 % im Vergleich zur aktuellen besten Methode für schwach überwachte Objektlokalisation erhöht, abhängig von den Konfigurationen.