تستخدم الفنادق التعلم الآلي للتنبؤ بالضيوف الذين سيقفون

في الوقت الحاضر، تم تطبيق البيانات الضخمة في جميع مناحي الحياة، وصناعة الفنادق ليست استثناءً. من خلال الاستفادة الكاملة من البيانات الضخمة، يمكن للفنادق التنبؤ بالتغيرات في الطلب في السوق، وإجراء تحليلات ذكية لاتخاذ القرارات، وتحسين ظروف التشغيل الخاصة بها.
في الوقت الحاضر، ساهمت منصات OTA (وكالات السفر عبر الإنترنت) الرئيسية في تسهيل سفر الأشخاص بشكل كبير. يمكن حجز الإقامة في الفندق وتذاكر المعالم السياحية وما إلى ذلك بسهولة ببضع نقرات فقط.

ومن أجل جذب المزيد من المستخدمين لإجراء الحجوزات، ستشجع هذه المنصات التجار على وضع سياسات إلغاء أكثر مرونة، مثل الإلغاء المجاني في أي وقت، أو الإلغاء المجاني خلال فترة زمنية محدودة.
يعد موقع Booking.com، أكبر موقع لحجز الفنادق عبر الإنترنت في العالم من حيث مبيعات الغرف، مشهورًا بين المسافرين بسبب ميزة الإلغاء المجاني.
ومع ذلك، فإن "الإلغاء المجاني" يعد أمرًا رائعًا بالنسبة للمستخدمين، ولكنه يشكل صداعًا للفنادق. يؤدي الإلغاء المؤقت للطلب عادةً إلى الخسائر التالية للفندق:
- لا يمكن بيع الغرف الملغاة في الوقت المناسب، ويخسر الفندق إيراداته؛
- الفنادق تخفض الأسعار لبيع الغرف الملغاة، مما يقلل الأرباح
- ولكي يتمكن الفندق من حجز هذه الغرف في أسرع وقت ممكن، فإنه يحتاج إلى تحمل تكاليف إضافية للقنوات الإعلانية والتوزيع؛
بما أن المستخدمين يستطيعون إيقاف الفندق في أي وقت، فهل هناك أي طريقة للفندق لتقليل الخسائر؟
مانويل بانزا، محلل أعمال برتغالي (بكالوريوس في الآداب، منصب يعادل مدير منتج في شركة تكنولوجيا المعلومات)، لديه أكثر من خمس سنوات من الخبرة في إدارة الفنادق.هووباستخدام البيانات المتاحة للعامة من منصات حجز الفنادق الأوروبية، اكتشفنا خصائص المستخدمين الأكثر عرضة لإلغاء الطلبات، مما يساعد الفنادق على وقف الخسائر في الوقت المناسب.
من بين ما يقرب من 120 ألف بيانات حجز الفنادق، وجدنا نمطًا
باعتباره متحمسًا لعلم البيانات، بدأ مانويل بانزا بعلم البيانات والتعلم الآلي.
هو أولا مجموعة بيانات طلب حجز الفنادق(طلب حجز الفنادق) أجرى تحليلاً شاملاً. تحتوي مجموعة البيانات هذه على 32 بُعدًا من البيانات للفنادق العادية والفنادق المنتجعية، بما في ذلك:
معلومات مثل جنسية المستخدم، ووقت الحجز، ومدة الإقامة، وعدد البالغين والأطفال أو الرضع، وما إذا كان الطلب قد تم إلغاؤه في النهاية، والعدد الإجمالي للمرات التي ألغى فيها المستخدم الطلبات قبل هذا الطلب.
طلب حجز الفنادق
مجموعة بيانات طلب حجز الفنادق
وكالة النشر:جامعة لشبونة، البرتغال
الكمية المتضمنة:إجمالي 119390 بيانات، 32 بُعدًا
تنسيق البيانات:ملف CSV حجم البيانات:16.9 ميجابايت (1.3 ميجابايت مضغوط)
عنوان:https://orion.hyper.ai/datasets/14866

ومن خلال الإحصائيات، وجد مانويل بانزا أن الكثير من المستخدمين قاموا بإلغاء حجوزات الفنادق الخاصة بهم في عام واحد.
في عام 2018، قام 49.8% من المستخدمين على منصة الحجز عبر الإنترنت بإلغاء طلباتهم؛ وفي مجموعة HRS، وصلت هذه النسبة إلى 66%. . بشكل عام، وصل متوسط معدل إلغاء طلبات الحجز عبر منصات متعددة إلى 39.6% في عام 2018.

وبعد ذلك، أجرى المؤلف تحليلاً استكشافيًا للبيانات ووجد ما يلي:
- بالمقارنة مع الفنادق العادية والفنادق المنتجعية، من المرجح أن يقوم الضيوف بإلغاء الحجوزات؛
- معدل الإلغاء أعلى خلال مهرجان الربيع والصيف، في حين أن أدنى معدل هو في فصل الشتاء؛
- من بين قنوات الحجز المختلفة، يقوم المستخدمون بوضع معظم الطلبات على منصات OTA، ولكن يتم أيضًا إلغاء معظم الطلبات على منصات OTA.
- كلما قام المستخدم بالحجز مبكرًا، كلما زاد عدم اليقين وزاد احتمال الإلغاء.
ويذكر المؤلفون أن وقت الحجز يعد أحد أهم المقاييس عند تحليل أداء إيرادات الفنادق. وتظهر نتائج التحليل أن احتمال إلغاء الحجوزات التي تتم قبل أكثر من عام هو الأعلى، حيث بلغ 57.14%؛ احتمالية إلغاء الحجوزات التي تتم خلال أسبوع هي الأدنى، عند 7.73%.

نموذج التعلم الآلي: التنبؤ بمن هو الأكثر احتمالاً للوقوف
بعد إجراء تحليل شامل لمجموعة البيانات، بدأ المؤلفون في بناء نموذج للتنبؤ بإلغاء الطلبات.
الخطوة 1: تنظيف البيانات
أولاً، نقوم بمعالجة القيم المفقودة في مجموعة البيانات. يجب استبدال هذه القيم المفقودة بمتوسط الخاصية إذا كان المتغير رقميًا أو بثابت إذا كان المتغير فئويًا.
ثم قم بإزالة reservation_status (حالة الحجز، التي تمثل ما إذا كان الطلب قد تم إلغاؤه، 0 لعدم الإلغاء و1 للإلغاء) لأن هذه هي القيمة التي سيتوقعها نموذج التعلم الآلي.
الخطوة 2: اختر أفضل نموذج
قبل البدء في اختبار أفضل خوارزمية لبياناتك، قم بتقسيم مجموعة البيانات بنسبة 8:2. بعد ذلك، سيتم استخدام 80% من البيانات لتدريب النموذج وسيتم استخدام 20% من البيانات كمجموعة للتحقق من الصحة.
في مجال علم البيانات، يعد التنبؤ بإلغاء الطلبات مشكلة تصنيف خاضعة للإشراف، والمعروفة أيضًا باسم التصنيف الثنائي. لذلك،قام المؤلف باختيار العديد من نماذج التصنيف الثنائي الموجودة مثل LightGBM وCatBoost وXGBoost وH2O، وقام بتدريبها ومقارنتها، وأخيرًا اختار نموذج CatBoost الذي يتمتع بأفضل النتائج التجريبية.
من خلال نتائج التنبؤ CatBoost، وجدنا النقاط التالية:
- إذا كانت جنسية المستخدم برتغالية، فإن احتمال الإلغاء يكون مرتفعًا. ومع ذلك، بالنسبة للحجوزات الجماعية، لا تحصل الفنادق عادةً على معلومات جنسية كل شخص مسبقًا. إذا تم إلغاء الحجز، فإن معظم الفنادق ستعتمد بشكل افتراضي على جنسية البلد الذي يقع فيه الفندق. لذلك، هذه المعلومات هي للإشارة فقط وقد لا تكون دقيقة؛
- كان المستخدمون الذين لم يقدموا أي طلبات خاصة أكثر عرضة لإلغاء طلباتهم مقارنة بأولئك الذين قدموا طلبًا خاصًا واحدًا على الأقل؛
- كلما انخفضت قيمة lead_time (عدد الأيام بين وقت الحجز ووقت تسجيل الوصول)، انخفضت احتمالية إلغاء الحجز (تتوافق نتيجة التنبؤ هذه مع نتائج تحليل البيانات السابقة).

أداء نموذج CatBoost على مجموعة التحقق:

الأداء على مجموعة بيانات "طلب حجز الفنادق" بأكملها:

الفندق: قبل أن تلغي حجزك، دعني أوفر بعض المال
وباستخدام هذا النموذج التنبئي، يمكن للفنادق أن تعرف مسبقًا المستخدمين الذين من المرجح أن يلغوا طلباتهم واتخاذ التدابير التصحيحية في الوقت المناسب.
على سبيل المثال، قم بالتواصل مع المستخدمين الذين من المرجح أن يقوموا بإلغاء الحجز مسبقًا، ومن خلال التواصل معهم، شجعهم على إلغاء الحجز في أقرب وقت ممكن، مما يتيح للفندق مزيدًا من الوقت لبيع الغرف.
وبدلاً من ذلك، يمكنك الاتصال بالمستخدمين الذين يميلون إلى الإلغاء، وتعريفهم بمزايا الفندق، وتقديم بعض مكافآت الإقامة لتغيير الوضع والاحتفاظ بهم.

مصدر الخبر:
https://www.linkedin.com/pulse/u-hotel-booking-cancellations-using-machine-learning-manuel-banza