Verbesserung der Personenlokalisierung in Drohnenbildern zur besseren Crowd Management durch die Nutzung jedes Pixels in hochaufgelösten Bildern

Die präzise Lokalisierung von Personen mittels Drohnen ist entscheidend für eine effektive Menschenmassensteuerung, nicht nur während großer Veranstaltungen und öffentlicher Versammlungen, sondern auch zur Überwachung des täglichen Stadtverkehrs. Traditionelle Methoden zur Lokalisierung kleiner Objekte anhand hochauflösender Drohnenbilder leiden häufig an Einschränkungen hinsichtlich Genauigkeit und Effizienz, vor allem aufgrund der Beschränkungen bei der Bildskalierung und der Sliding-Window-Techniken. Um diese Herausforderungen zu bewältigen, wird ein neuartiger Ansatz für die punktbezogene Objektlokalisierung vorgestellt. Zusätzlich wird der Pixel Distill-Modul eingeführt, um die Verarbeitung von High-Definition-Bildern zu verbessern, indem er räumliche Informationen gleichzeitig aus einzelnen Pixeln extrahiert. Außerdem wird ein neues Datenset namens UP-COUNT vorgestellt, das speziell für moderne Drohnenanwendungen konzipiert ist und eine Vielzahl von Herausforderungen in Drohnenbildern abdeckt, wie beispielsweise gleichzeitige Bewegungen der Kamera und der Objekte während des Bildaufnahmeprozesses, wodurch die Fähigkeiten von Anwendungen zur Menschenmassensteuerung erheblich erweitert werden. Eine umfassende Evaluation des vorgeschlagenen Ansatzes auf dem eigenen Datenset sowie auf dem weit verbreiteten DroneCrowd-Datenset zeigt die Überlegenheit gegenüber bestehenden Methoden und unterstreicht die Wirksamkeit des Ansatzes bei der Lokalisierung von Personen in Drohnenbildern. Diese Verbesserungen erhöhen die Anwendbarkeit des Algorithmus erheblich für reale Einsatzszenarien und ermöglichen eine zuverlässigere Lokalisierung und Zählung von Individuen in dynamischen Umgebungen.