StreetSense: Sicherere Fußwege in San Francisco mit KI
Nach einem Abend in Downtown San Francisco stand ich vor der Frage, wie ich sicher und bewusst nach Hause gelangen könnte – nicht nur schnell, sondern auch sicher. Während Google Maps mir die kürzeste Route zeigte, fehlte eine entscheidende Dimension: die subjektive Sicherheit zu bestimmten Zeiten. Dies führte zur Entwicklung von StreetSense, einem Werkzeug, das mithilfe von räumlich-zeitlichen maschinellen Lernmodellen die erwartete Gehrisiko entlang von Routen prognostiziert. Ziel war es, nicht nur Distanz oder Dauer zu optimieren, sondern kontextbezogene Sicherheitsinformationen bereitzustellen – insbesondere für späte Abende oder unbekannte Viertel. Die Grundlage bildet der öffentliche Datensatz der Stadt San Francisco mit Polizeiberichten seit 2018, die strukturierte Informationen zu Ort, Zeit und Art von Vorfällen enthalten. Um eine sinnvolle Risikomessung zu ermöglichen, wurden die über 800 eindeutigen Incident-Typen mit Hilfe einer großen Sprachmodell (LLM) auf einer 0–10-Skala nach drei Dimensionen bewertet: Schwere, Häufigkeit und öffentliche Wahrnehmung. Diese Scores wurden kombiniert, um ein differenziertes Risikosignal zu erzeugen, das nicht nur auf Zahlen, sondern auch auf semantischer Bedeutung basiert. Zur räumlichen Aggregation wurde das H3-Geokodierungssystem verwendet – ein hexagonales Gitternetz, das die Erdoberfläche in gleichförmige Zellen unterteilt. Dies ermöglichte eine konsistente räumliche Darstellung, bei der Nachbarschaftsbeziehungen gleichmäßig und intuitiv sind. Zeitliche Aspekte wurden durch sinusoide Transformationen von Stunden und Wochentagen berücksichtigt, um zyklische Phänomene wie Nacht und Morgen korrekt zu erfassen. Zudem wurden Ereignisse in 3-Stunden-Intervalle gruppiert, um eine Balance zwischen Granularität und statistischer Stabilität zu finden. Als Modell wurde XGBoost gewählt, da es nichtlineare Muster in tabellarischen Daten effizient erfasst und bei geringer Latenz für Echtzeitanwendungen geeignet ist. Die Zielvariable – erwartetes Risiko – folgt einer rechtssteilen, nullüberzogenen Verteilung, typisch für seltene, aber schwere Vorfälle. Daher wurde Tweedie-Regression eingesetzt, die Poisson- und Gamma-Verteilungen kombiniert, um sowohl die Anzahl als auch die Schwere von Vorfällen zu modellieren. So wird beispielsweise ein einzelner schwerer Vorfall im Presidio nicht überbewertet, während ein hochfrequentes, mittelgradiges Vorkommen im Tenderloin angemessen berücksichtigt wird. Die Ergebnisse werden visuell auf einer Karte dargestellt: grün (sicher), gelb (moderat), orange (risikoreich), rot (hochriskant), basierend auf Perzentilen der Verteilung. Bei hohem Risiko rechnet die App automatisch eine alternative Route aus, sofern der Umweg maximal 15 % länger ist – eine pragmatische Balance zwischen Sicherheit und Effizienz. Die Anwendung wurde mit Google Maps API, Render (Backend) und Vercel (Frontend) deployed und steht unter https://san-francisco-safety-index.vercel.app zur Verfügung. Industrieexperten loben den Ansatz als innovativ und nutzbringend für städtische Mobilität, insbesondere für Touristen und Nachtschichtarbeiter. Die Kombination aus H3, Zeittransformation und Tweedie-Regression wird als Best Practice für räumlich-zeitliche Risikomodelle angesehen. Kritisch wird jedoch darauf hingewiesen, dass das Modell auf historischen Daten basiert und keine zukünftigen Ereignisse vorhersagt. Es dient nicht als Sicherheitsgarantie, sondern als Entscheidungshilfe. Zukünftige Verbesserungen könnten durch Echtzeit-Daten, soziale Medien-Feeds oder Verkehrsflussdaten erfolgen. StreetSense zeigt, wie maschinelles Lernen und offene Daten gemeinsam zur Schaffung intelligenter, menschenzentrierter Stadtmobilität beitragen können – ohne Orte zu stereotypisieren, sondern vielmehr Kontext zu liefern.
