San Franciscoの歩行リスクを時空間機械学習で可視化 StreetSenseが安全なルートを提案
サンフランシスコで夜遅くに帰宅する際、Googleマップは最短経路を提示するが、安全なルートかどうかは教えてくれない。この課題に向き合い、開発者が自らの判断を補完できるようにするため、空間時間的な機械学習モデル「StreetSense」を構築した。目的は、出発地・目的地・日時(曜日・時間)を入力すると、そのルートにおける「予測される歩行リスク」を空間的にも時間的にも可視化することだ。 データはサンフランシスコ市が公開する警察報告データ(2018年1月~現在)を活用。800以上の事件種別を抽出し、大規模言語モデル(LLM)で各事件の「重大度スコア」(0~10)を三つの次元(暴力性、財産損壊、社会的影響)で評価。これを統合して、各事件のリスクを数値化。空間表現にはUberが開発したH3グリッド技術を採用。地球を正二十面体で分割し、六角形と12の五角形で均等にタイル化することで、街区レベルでのリスク集計が可能に。時間表現では、時刻と曜日をサイン・コサイン変換で周期的にエンコードし、23時59分と0時00分の時間的連続性をモデルが学習できるようにした。 特徴量はH3セル、時間帯、曜日を組み合わせ、リスク予測モデルとしてXGBoostを採用。理由は、非線形パターンを捉えつつ、低遅延で推論が可能で、タブレットデータに適している点。また、犯罪発生は「ゼロ過剰」で右に歪んだ分布を示すため、Tweedie回帰を用いて、発生件数と各事件の平均重大度の積として「期待リスク」をモデル化。これにより、稀な重大事件と、頻度は高いが重大度は低い事件の両方を適切に反映。 実装ではGoogleマップAPIと連携し、ルートに色を塗り分ける。リスクの割合で色分け:P50以下=緑(安全)、P75以下=黄、P90以下=橙、それ以上=赤。また、リスクが高くなる区間を避け、元のルートより15%以内の遅延で再ルート化する機能も搭載。 実際に「チャイナタウン→マーケット&ヴァンネス」を9時(火曜)と23時(土曜)で比較すると、夜間は赤や橙の区間が増加し、モデルが安全な迂回路を自動提示する。これは、単なる最短距離ではなく、状況に応じた意思決定支援の実現である。 現在のモデルは過去のデータに基づくため、未来の出来事の予測ではない。しかし、観光客や地元住民が「どこを避け、いつどう歩くか」をより意識的に判断するための「状況認識ツール」としての価値がある。今後の改善点として、リアルタイムの交通や集会情報の統合、ユーザーのフィードバックによる学習が挙げられる。このモデルは、都市の安全を単純な「安全/危険」に分類するのではなく、動的なリスク理解を促すことを目指している。
