Kleinräumige Fußgnererkennung auf der Basis von Somatologischer Lokalisation und zeitlicher Merkmalsaggregation

Eine kritische Herausforderung bei der Fußgängererkennung ist die Detektion von kleinstabgelegten Objekten, die in Bildern und Videos geringen Kontrast und Bewegungsunschärfe verursachen. Unserer Meinung nach sollte hierfür teilweise auf tiefverwurzelte Annotationsschwierigkeiten zurückgegriffen werden. Aus diesem Antrieb heraus schlagen wir eine neuartige Methode vor, die somatische topologische Linienlokalisierung (TLL) und zeitliche Merkmalsaggregation für die Erkennung von Fußgängern verschiedener Größen integriert. Diese Methode funktioniert insbesondere gut bei kleinstabgelegten Fußgängern, die relativ weit vom Kameraobjektiv entfernt sind. Darüber hinaus wird ein Post-Processing-Verfahren basierend auf Markovschen Zufallsfeldern (MRF) eingeführt, um Unsicherheiten bei Verdeckungsfällen zu beseitigen. Durch die umfassende Anwendung dieser Methodiken erreichen wir die beste Erkennungsleistung im Caltech-Benchmark und verbessern erheblich die Leistung bei kleinstabgelegten Objekten (der Fehlerrate reduziert sich von 74,53 % auf 60,79 %). Darüber hinaus erzielen wir auch wettbewerbsfähige Ergebnisse im CityPersons-Datensatz und zeigen das Vorhandensein von Annotationsschwierigkeiten im KITTI-Datensatz.