HyperAI

Les Hôtels Utilisent L'apprentissage Automatique Pour Prédire Quels Clients Se Lèveront

il y a 4 ans
Ensemble de données
Vrai nerf
神经小兮
特色图像

De nos jours, le Big Data est appliqué dans tous les domaines de la vie, et l’industrie hôtelière ne fait pas exception. En exploitant pleinement le Big Data, les hôtels peuvent prévoir les changements de la demande du marché, mener des analyses décisionnelles intelligentes et améliorer leurs conditions d’exploitation.

De nos jours, les principales plateformes OTA (agences de voyages en ligne) ont grandement facilité les voyages des gens. L'hébergement à l'hôtel, les billets d'attraction, etc. peuvent être facilement réservés en quelques clics.

Il existe des dizaines de plateformes de réservation d'hôtels et de séjours chez l'habitant en France et à l'étranger

Afin d'inciter davantage d'utilisateurs à effectuer des réservations, ces plateformes encourageront les commerçants à mettre en place des politiques d'annulation plus souples, telles que l'annulation gratuite à tout moment ou l'annulation gratuite dans un délai limité.

Booking.com, le plus grand site de réservation d'hôtels en ligne au monde en termes de ventes de chambres, est populaire auprès des voyageurs en raison de son avantage d'annulation gratuite.

Cependant, « l’annulation gratuite » est très agréable pour les utilisateurs, mais c’est un casse-tête pour les hôtels. L'annulation temporaire d'une commande entraîne généralement les pertes suivantes pour l'hôtel :

  1. Les chambres annulées ne peuvent pas être vendues à temps et l’hôtel perd des revenus ;
  2. Les hôtels baissent leurs prix pour vendre les chambres annulées, réduisant ainsi leurs profits
  3. Afin de réserver ces chambres le plus rapidement possible, l'hôtel doit engager des frais supplémentaires pour la publicité et les canaux de distribution ;

Étant donné que les utilisateurs peuvent fermer l’hôtel à tout moment, existe-t-il un moyen pour l’hôtel de minimiser les pertes ?

Manuel Banza, analyste d'affaires portugais (BA, poste équivalent à celui de chef de produit dans une entreprise informatique), a plus de cinq ans d'expérience dans la gestion hôtelière.ilEn utilisant les données accessibles au public provenant des plateformes européennes de réservation d'hôtels, nous avons découvert les caractéristiques des utilisateurs les plus susceptibles d'annuler leurs commandes, aidant ainsi les hôtels à stopper les pertes en temps opportun.

À partir de près de 120 000 données de réservation d’hôtel, nous avons trouvé un modèle

En tant que passionné de science des données, Manuel Banza a commencé par la science des données et l'apprentissage automatique.

Il est le premier « Ensemble de données sur la demande de réservation d'hôtel »(Demande de réservation d'hôtel) a mené une analyse complète. Cet ensemble de données contient 32 dimensions de données pour les hôtels ordinaires et les hôtels de villégiature, notamment :

Des informations telles que la nationalité de l'utilisateur, l'heure de réservation, la durée du séjour, le nombre d'adultes et d'enfants ou de nourrissons, si la commande a finalement été annulée et le nombre total de fois où l'utilisateur a annulé des commandes avant cette commande.

Demande de réservation d'hôtel 

Ensemble de données sur la demande de réservation d'hôtel

Agence d'édition :Université de Lisbonne, Portugal

Quantité incluse :Un total de 119 390 données, 32 dimensions

Format des données :csv Taille des données :16,9 Mo (1,3 Mo compressé)

adresse:https://orion.hyper.ai/datasets/14866

Certains affichages de données

Grâce aux statistiques, Manuel Banza a constaté que de nombreux utilisateurs annulaient leurs commandes d'hôtel en un an.

En 2018, 49,8 % des utilisateurs de la plateforme OTA Booking ont annulé leurs commandes ; sur le groupe HRS, cette proportion était aussi élevée que 66%. . Dans l’ensemble, le taux moyen d’annulation des commandes de réservation de plusieurs plateformes a atteint 39,6% en 2018.

La proportion de commandes annulées par les différents canaux de réservation

Ensuite, l’auteur a mené une analyse exploratoire des données et a constaté ce qui suit :

  • Par rapport aux hôtels classiques et aux complexes hôteliers, les réservations sont plus susceptibles d’être annulées par les clients ;
  • Le taux d’annulation est plus élevé pendant la Fête du Printemps et l’été, tandis que le taux le plus bas est observé en hiver ;
  • Parmi les différents canaux de réservation, les utilisateurs passent le plus de commandes sur les plateformes OTA, mais la plupart des commandes sont également annulées sur les plateformes OTA.
  • Plus tôt l’utilisateur effectue une réservation, plus grande est l’incertitude et plus grande est la probabilité d’annulation.

Les auteurs affirment que le temps de réservation est l’une des mesures les plus importantes lors de l’analyse des performances des revenus des hôtels. Les résultats de l’analyse montrent que la probabilité d’annulation des réservations effectuées plus d’un an à l’avance est la plus élevée, soit 57.14% ; la probabilité d'annulation des réservations effectuées dans la semaine est la plus faible, à 7,73%.

Le nombre de jours avant la réservation (axe horizontal) est proportionnel à la probabilité d'annulation (axe vertical),Il semble que plus vous planifiez tôt, moins vous avez de chances de suivre les changements.

Modèle d'apprentissage automatique : prédire qui est le plus susceptible de se lever

Après une analyse approfondie de l’ensemble de données, les auteurs ont commencé à construire un modèle pour prédire les annulations de commandes.

Étape 1 : Nettoyage des données

Tout d’abord, nous traitons les valeurs manquantes dans l’ensemble de données. Ces valeurs manquantes doivent être remplacées par la moyenne de la caractéristique si la variable est numérique ou par une constante si la variable est catégorielle.

Supprimez ensuite reservation_status (statut de réservation, qui indique si la commande a été annulée, 0 pour non annulée et 1 pour annulée) car c'est la valeur que le modèle d'apprentissage automatique prédira.

Étape 2 : Sélectionnez le meilleur modèle

Avant de commencer à tester le meilleur algorithme pour vos données, divisez l’ensemble de données dans un rapport de 8:2. Après cela, 80 % des données seront utilisées pour former le modèle et 20 % des données seront utilisées comme ensemble de validation.

Dans le domaine de la science des données, la prédiction des annulations de commandes est un problème de classification supervisée, également appelé classification binaire. donc,L'auteur a sélectionné plusieurs modèles de classification binaire existants tels que LightGBM, CatBoost, XGBoost et H2O, les a formés et comparés, et a finalement sélectionné le modèle CatBoost avec les meilleurs résultats expérimentaux.

Grâce aux résultats de prédiction de CatBoost, nous avons trouvé les points suivants :

  1. Si la nationalité de l'utilisateur est portugaise, la probabilité d'annulation est élevée. Cependant, pour les réservations de groupe, les hôtels n'obtiennent généralement pas à l'avance les informations sur la nationalité de chaque personne. Si une réservation est annulée, la plupart des hôtels attribueront par défaut la nationalité du pays où se trouve l'hôtel. Par conséquent, ces informations sont fournies à titre indicatif uniquement et peuvent ne pas être exactes ;
  2. Les utilisateurs qui n’ont fait aucune demande spéciale étaient plus susceptibles d’annuler leurs commandes que ceux qui ont fait au moins une demande spéciale ;
  3. Plus la valeur du délai d'exécution (le nombre de jours entre l'heure de réservation et l'heure d'enregistrement) est faible, plus la possibilité d'annulation de la réservation est faible (ce résultat de prédiction est cohérent avec les résultats de l'analyse des données précédentes).
Le célèbre hôtel Eurostars Museum au Portugal présente une exposition archéologique,Lancé sur plusieurs plateformes OTA, prenant en charge la réservation en ligne et l'annulation gratuite

Performances du modèle CatBoost sur l'ensemble de validation :

Performances sur l'ensemble des données « demande de réservation d'hôtel » :

Hôtel : Avant d'annuler, laissez-moi économiser de l'argent

Grâce à ce modèle prédictif, les hôtels peuvent savoir à l’avance quels utilisateurs sont susceptibles d’annuler leurs commandes et prendre des mesures correctives en temps opportun.

Par exemple, contactez à l'avance les utilisateurs les plus susceptibles d'annuler et, par le biais de la communication, encouragez-les à annuler le plus tôt possible, laissant ainsi à l'hôtel plus de temps pour vendre des chambres.

Alternativement, vous pouvez contacter les utilisateurs qui sont enclins à annuler, leur présenter les avantages de l'hôtel et leur offrir des récompenses de séjour pour inverser la tendance et les fidéliser.

L'apprentissage automatique aide les hôtels à prendre les devants

Source de l'information :

https://www.linkedin.com/pulse/u-hotel-booking-cancellations-using-machine-learning-manuel-banza