HyperAIHyperAI

Command Palette

Search for a command to run...

融合时空机器学习的城区步行风险智能建模

在旧金山 downtown 吃完晚餐后,我与朋友道别,掏出手机想规划回家路线。已是晚上11点半,Uber的预估时间异常漫长,于是我打开谷歌地图,查看步行路线。虽然几条路线距离相近,耗时约40分钟,但我却犹豫了——不是因为路程太远,而是不确定不同路段在深夜是否安全。谷歌地图能告诉我最快路径,却无法回答我真正关心的问题:如何选择一条更安全的路线,而非最快的一条? 这个问题的核心是:给定起点、终点、日期和时间,如何预测步行路径上的预期风险?例如,从中国城步行至市场街与南范尼斯街交汇处,谷歌地图会提供几条相似的路线。但这些路线在白天与深夜的“感受”可能截然不同。同一条路在周二上午9点和周六晚上11点,风险水平可能大不相同。当路线较长或穿越历史活动模式差异大的区域时,这种直觉判断变得更加困难。 为解决这一问题,我构建了一个名为StreetSense的工具,利用历史警情数据与时空机器学习模型,量化城市中不同区域在不同时段的风险变化。项目基于旧金山市政府开放数据门户发布的警情报告,涵盖2018年至今的事件类别、子类、描述、时间和经纬度信息。 首先,我将超过800种事件组合进行分类,并使用大语言模型为每种事件类型打分,从三个维度(严重性、暴力程度、公共影响)进行0-10分评估,形成综合风险信号。为实现空间聚合,我采用Uber的H3网格系统,将城市划分为六边形区域,确保空间邻近性一致,便于建模。 时间方面,我采用正弦与余弦变换编码小时与星期,解决23:59与00:00在数值上不连续的问题。同时将时间划分为3小时窗口,兼顾细节与稳定性。 特征工程完成后,我使用XGBoost模型预测每个H3网格在特定时间的风险值。考虑到警情数据具有“零膨胀”和右偏分布特征(即大多数区域风险极低,但少数高危事件影响巨大),我采用Tweedie回归——它结合泊松分布(事件数量)与伽马分布(事件严重性),精准捕捉“高风险事件虽少但影响大”的特性。 最终模型输出的是“预期风险”,而非二元安全标签或单一事件严重性。这避免了对罕见极端事件的过度反应,同时反映长期风险趋势。 我将模型集成至网页应用,通过Google Maps API叠加风险热力图:绿(P50以下,安全)、黄(P75以下,较安全)、橙(P90以下,中等风险)、红(高风险)。当用户选择路线时,系统可自动推荐一条风险更低、绕行不超过15%的替代路径。 例如,从中国城到市场街的夜间步行,在周六晚11点,系统会自动推荐一条更安全的绕行路线;而周二上午9点,原路线整体风险较低,绿色区域占主导。 该模型基于历史数据,反映的是趋势而非个体预测,旨在提供决策参考,而非绝对判断。它帮助人们在陌生区域、陌生时间做出更明智的出行选择。 项目已上线:https://san-francisco-safety-index.vercel.app 数据来源:旧金山开放数据门户,遵循公开许可协议。 感谢旧金山开放数据团队与相关研究文献的支持。

相关链接

融合时空机器学习的城区步行风险智能建模 | 热门资讯 | HyperAI超神经