HyperAI

在旧金山 downtown 吃完晚餐后，我与朋友道别，掏出手机想规划回家路线。已是晚上11点半，Uber的预估时间异常漫长，于是我打开谷歌地图，查看步行路线。虽然几条路线距离相近，耗时约40分钟，但我却犹豫了——不是因为路程太远，而是不确定不同路段在深夜是否安全。谷歌地图能告诉我最快路径，却无法回答我真正关心的问题：如何选择一条更安全的路线，而非最快的一条？这个问题的核心是：给定起点、终点、日期和时间，如何预测步行路径上的预期风险？例如，从中国城步行至市场街与南范尼斯街交汇处，谷歌地图会提供几条相似的路线。但这些路线在白天与深夜的“感受”可能截然不同。同一条路在周二上午9点和周六晚上11点，风险水平可能大不相同。当路线较长或穿越历史活动模式差异大的区域时，这种直觉判断变得更加困难。为解决这一问题，我构建了一个名为StreetSense的工具，利用历史警情数据与时空机器学习模型，量化城市中不同区域在不同时段的风险变化。项目基于旧金山市政府开放数据门户发布的警情报告，涵盖2018年至今的事件类别、子类、描述、时间和经纬度信息。首先，我将超过800种事件组合进行分类，并使用大语言模型为每种事件类型打分，从三个维度（严重性、暴力程度、公共影响）进行0-10分评估，形成综合风险信号。为实现空间聚合，我采用Uber的H3网格系统，将城市划分为六边形区域，确保空间邻近性一致，便于建模。时间方面，我采用正弦与余弦变换编码小时与星期，解决23:59与00:00在数值上不连续的问题。同时将时间划分为3小时窗口，兼顾细节与稳定性。特征工程完成后，我使用XGBoost模型预测每个H3网格在特定时间的风险值。考虑到警情数据具有“零膨胀”和右偏分布特征（即大多数区域风险极低，但少数高危事件影响巨大），我采用Tweedie回归——它结合泊松分布（事件数量）与伽马分布（事件严重性），精准捕捉“高风险事件虽少但影响大”的特性。最终模型输出的是“预期风险”，而非二元安全标签或单一事件严重性。这避免了对罕见极端事件的过度反应，同时反映长期风险趋势。我将模型集成至网页应用，通过Google Maps API叠加风险热力图：绿（P50以下，安全）、黄（P75以下，较安全）、橙（P90以下，中等风险）、红（高风险）。当用户选择路线时，系统可自动推荐一条风险更低、绕行不超过15%的替代路径。例如，从中国城到市场街的夜间步行，在周六晚11点，系统会自动推荐一条更安全的绕行路线；而周二上午9点，原路线整体风险较低，绿色区域占主导。该模型基于历史数据，反映的是趋势而非个体预测，旨在提供决策参考，而非绝对判断。它帮助人们在陌生区域、陌生时间做出更明智的出行选择。项目已上线：https://san-francisco-safety-index.vercel.app 数据来源：旧金山开放数据门户，遵循公开许可协议。感谢旧金山开放数据团队与相关研究文献的支持。

相关链接

相关链接

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

Command Palette

融合时空机器学习的城区步行风险智能建模

相关链接

Command Palette

融合时空机器学习的城区步行风险智能建模

相关链接

Command Palette

融合时空机器学习的城区步行风险智能建模

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化