Steigerung der Fußgängererkennungsleistung durch Gewichtung von erkenntnisbeeinträchtigenden Faktoren
Objektdetektion ist eine etablierte Technik, die sich der Detektionsleistung menschlicher Wahrnehmung annähert. In diesem Artikel wird ein Verfahren vorgestellt, das die verbleibende Lücke in der Detektionsfähigkeit weiter schließt, indem visuelle Faktoren untersucht werden, die die Erkennbarkeit von Objekten beeinträchtigen. Da einige dieser Faktoren in realen Sensordaten schwer oder gar nicht messbar sind, wird ein Detektor auf synthetischen Daten trainiert, wodurch perfekte Messungen und Ground-Truth-Daten in großer Skala verfügbar werden. Der resultierende Detektor wird anschließend verwendet, um eine empirische Gewichtungslösung (Weighting Loss) zu kalibrieren, die Stichproben aus realen Trainingsdaten sowie die zugehörigen Detektionsbeeinträchtigungs-Faktoren gewichtet. Das Verfahren wird auf die Aufgabe der Fußgängererkennung in Verkehrsszenen angewendet. Die Wirksamkeit der empirischen Detektionsbeeinträchtigungs-Gewichtungslösung (DIW-Loss) wird an einem auf dem CityPersons-Datensatz trainierten Detektor demonstriert und erreicht eine neue State-of-the-Art-Leistung auf diesem Benchmark, wobei die vorherige beste Leistung um 1,88 % übertroffen wird.