نموذج تقييم مخاطر المشي الحضري باستخدام تعلم الآلة الزمانية-المكانية
بعد عشاء في وسط سان فرانسسكو، وجدت نفسي أمام خيارين: الانتظار لساعات لاستئجار تاكسي، أو المشي إلى المنزل في منتصف الليل. بينما كانت خرائط جوجل تُظهر المسارات المماثلة من حيث الطول، لم تُقدِّم أي مساعدة في الإجابة على السؤال الحقيقي: أي طريق يمرّ بأحياء أكثر أمانًا في هذه الساعة؟ هذا السؤال دفعني إلى تطوير أداة تُسمّى "ستريت سينس" (StreetSense)، تُقدّم تقييمًا ذكيًا للخطر أثناء المشي في المدينة، مبنيًا على بيانات تاريخية وتعلم آلي مكاني-زمني. الهدف كان بسيطًا لكنه معقد من الناحية التقنية: كيف نُقدّر مستوى الخطر المتوقع على مسار مشي معين، مع الأخذ بعين الاعتبار الموقع، الوقت، واليوم؟ لحل هذا، استخدمت بيانات تقارير الشرطة من منصة البيانات المفتوحة في سان فرانسسكو، التي تغطي الفترة من 2018 حتى اليوم. تضم البيانات فئات مختلفة من الحوادث، من التلفيات البسيطة إلى الجرائم العنيفة، ما جعل من الضروري تصنيفها حسب درجة الخطورة. بدلاً من معاملة كل حادث بنفس الدرجة، استخدمت نموذج لغة ذكية (LLM) لتصنيف كل نوع من الحوادث على ثلاث محاور: شدة الحدث، احتمالية تكراره، وتأثيره على السلامة العامة. ثم دُمجت هذه الدرجات لتكوين مؤشر موحد للخطر. لتمثيل الموقع، استخدمت نظام H3 من أوبر، الذي يُقسّم الأرض إلى خلايا سداسية منتظمة، تسمح بتجميع البيانات حسب المنطقة بدقة، مع الحفاظ على التماثل في المسافات بين الخلايا. هذا يُحسّن دقة التقديرات المكانية مقارنةً بالشبكات المربعة التقليدية. بالنسبة للزمن، استخدمت تحويلات الجيب والجيب التمام (sine/cosine) لتمثيل الساعات والأيام بشكل دوري، مما يسمح للنموذج بفهم أن منتصف الليل قريب من الصباح، رغم الفرق الرقمي الكبير. كما قُسّمت الأوقات إلى فترات ثلاث ساعات، لتوازن بين التفاصيل والموثوقية. بعد التحضير، تم تدريب نموذج XGBoost لتنبؤ مستوى الخطر في كل خلية مكانية وزمنية. اخترت XGBoost لأنه يوازن بين الأداء والسرعة، ويُقدّر التفاعلات غير الخطية في البيانات بكفاءة. بما أن بيانات الحوادث تُظهر توزيعًا غير متماثل، مع كثرة الأصفار (مناطق لا تحدث فيها حوادث) وندرة حوادث عالية الخطورة، استخدمت الانحدار التويدي (Tweedie Regression)، الذي يُعالج هذه التوزيعات المعقدة من خلال نمذجة عدد الحوادث (باستخدام توزيع بواسون) وشدة كل حادث (باستخدام توزيع غاما). هذا يُعطي نتائج أكثر واقعية، حيث تُراعى كل من التكرار والخطورة. النتيجة ليست "آمن" أو "غير آمن"، بل "مستوى خطر متوقع"، مما يُقلل من التفاعل المفرط مع حوادث نادرة، ويعكس الأنماط المستمرة. عند استخدام التطبيق، تُلوّن المسارات حسب مئينات الخطر: أخضر (آمن)، أصفر (متوسط)، برتقالي (مُحتمل)، أحمر (مُحفوف بالمخاطر). إذا كان التحويل إلى مسار أمن أكثر لا يتجاوز 15% من الزمن الأصلي، يُقترح تغيير المسار تلقائيًا. تم نشر التطبيق على Vercel، مع خادم خلفي على Render، وتم دمجه بخرائط جوجل. في مثال المشي من تشيناتاون إلى ماركت وفان نيس، تُظهر النتائج فرقًا كبيرًا بين 9 صباحًا يوم الثلاثاء و11 مساءً يوم السبت، حيث يُقترح مسار بديل آمن في الليل. النموذج لا يُنبئ بالمستقبل، بل يُقدّم سياقًا مبنيًا على الماضي. الهدف ليس تصنيف الأحياء، بل تمكين الناس من اتخاذ قرارات واعية. المشروع يُظهر كيف يمكن للذكاء الاصطناعي، عند تطبيقه بذكاء، أن يُحسّن تجربة الحياة اليومية في المدينة، خاصة في لحظات التوتر أو عدم الراحة.
