Analyse Prédictive
L'analyse prédictive est le processus d'utilisation des données pour prédire les résultats futurs.Ce processus utilise l’analyse de données, l’apprentissage automatique, l’intelligence artificielle et les modèles statistiques pour rechercher des modèles susceptibles de prédire le comportement futur. Les organisations peuvent utiliser des données historiques et actuelles pour prédire les tendances et les comportements dans les secondes, les jours ou les années à venir avec une grande précision.
Comment fonctionne l'analyse prédictive
Les scientifiques des données utilisent des modèles prédictifs pour identifier les corrélations entre différents éléments d’un ensemble de données sélectionné. Une fois les données collectées, un modèle statistique est développé, formé et modifié pour générer des prédictions.
Le flux de travail pour la création d’un cadre d’analyse prédictive comprend cinq étapes de base :
- Définir le problème:La prévision commence par un bon sujet et un ensemble d’exigences. Par exemple, un modèle d’analyse prédictive peut-il détecter la fraude ? Pouvez-vous déterminer les niveaux de stock optimaux pour la période des achats des Fêtes ? Pouvez-vous déterminer les niveaux d’inondation qui peuvent résulter de conditions météorologiques extrêmes ? Une question claire à laquelle il faut répondre aidera à déterminer l’approche d’analyse prédictive à utiliser.
- Acquisition et organisation des données:Les organisations peuvent disposer de décennies de données accumulées ou d’un flux constant de quantités massives de données générées par les interactions avec les clients. Avant de développer un modèle d’analyse prédictive, les flux de données doivent être identifiés, puis les ensembles de données organisés en référentiels.
- Prétraitement des données:Les données brutes elles-mêmes ne sont que nominalement utiles. Pour préparer les données pour les modèles d'analyse prédictive, vous devez nettoyer les données pour supprimer les valeurs anormales, les points de données manquants ou les valeurs aberrantes extrêmes, qui peuvent être le résultat d'erreurs de saisie ou de mesure.
- Développer des modèles prédictifs:Les scientifiques des données peuvent utiliser une variété d’outils et de techniques pour développer des modèles prédictifs en fonction du problème à résoudre et de la nature de l’ensemble de données. L’apprentissage automatique, les modèles de régression et les arbres de décision sont les types de modèles prédictifs les plus courants.
- Vérifier et déployer les résultats:Vérifiez la précision du modèle et effectuez les ajustements en conséquence. Une fois les résultats acceptables obtenus, ils sont mis à la disposition des parties prenantes via une application, un site Web ou un tableau de bord de données.
Méthodes d'analyse prédictive
D’une manière générale, il existe deux types de modèles prédictifs : les modèles de classification et les modèles de régression. Les modèles de classification tentent d'attribuer des objets de données, tels que des clients ou des résultats potentiels, à une catégorie. Par exemple, si un détaillant dispose de nombreuses données sur différents types de clients, il peut essayer de prédire quels types de clients sont prêts à recevoir des e-mails marketing. Les modèles de régression tentent de prédire des données continues, telles que le montant des revenus qu'un client générera au cours de sa relation avec une entreprise.
Il existe trois principales approches analytiques couramment utilisées pour réaliser des analyses prédictives :
- Analyse de régression:La régression est une méthode d’analyse statistique utilisée pour estimer la relation entre les variables. La régression peut être utilisée pour identifier des modèles dans de grands ensembles de données, déterminant ainsi les corrélations entre les entrées. Cette méthode fonctionne mieux avec des données continues qui suivent une distribution connue. La régression est souvent utilisée pour déterminer comment une ou plusieurs variables indépendantes affectent une autre variable indépendante (par exemple, comment une augmentation de prix affecte les ventes d’un produit).
- Arbre de décision:L'arbre de décision est un modèle de classification qui peut classer les données en différentes catégories en fonction de différentes variables. Cette approche est idéale pour comprendre les décisions individuelles. Ce modèle ressemble à un arbre, chaque branche représentant un choix possible et les feuilles de la branche représentant les résultats de la décision. Les arbres de décision sont généralement faciles à comprendre et fonctionnent bien lorsque l’ensemble de données comporte plusieurs variables manquantes.
- Réseaux neuronaux:Les réseaux neuronaux sont des méthodes d’apprentissage automatique qui constituent des méthodes d’analyse prédictive très utiles lors de la modélisation de relations très complexes. Essentiellement, ce sont de puissants moteurs de reconnaissance de formes. Les réseaux neuronaux sont mieux utilisés pour identifier les relations non linéaires dans un ensemble de données, en particulier lorsqu'il n'existe pas de formule mathématique connue pour analyser les données. Les réseaux neuronaux peuvent être utilisés pour valider les résultats des modèles d’arbre de décision et de régression.
Utilisations et exemples de l'analyse prédictive
L'analyse prédictive peut être utilisée pour rationaliser les opérations, augmenter les revenus et réduire les risques pour presque toutes les entreprises ou tous les secteurs, y compris la banque, la vente au détail, les services publics, le secteur public, les soins de santé et la fabrication. Parfois, les gens utilisent également l’analyse augmentée, qui utilise l’apprentissage automatique sur le Big Data. Voici quelques autres cas d’utilisation :
- Détection de fraude :L’analyse prédictive examine toutes les actions au sein du réseau d’une entreprise en temps réel pour identifier les anomalies qui pourraient conduire à la fraude et à d’autres vulnérabilités.
- Prévisions de conversion et d'achat :Les entreprises peuvent prendre des mesures telles que le reciblage des visiteurs avec des publicités en ligne, en utilisant des données pour prédire quels visiteurs sont plus susceptibles de se convertir et ont une plus grande probabilité d'intention d'achat.
- Réduire les risques :L’évaluation du crédit, les réclamations d’assurance et le recouvrement de créances peuvent tous utiliser l’analyse prédictive pour évaluer et déterminer la probabilité d’un défaut futur.
- Améliorations opérationnelles :Les entreprises utilisent des modèles d’analyse prédictive pour prévoir les stocks, gérer les ressources et améliorer l’efficacité opérationnelle.
- Segmentation de la clientèle:En segmentant la clientèle en groupes spécifiques, les spécialistes du marketing peuvent utiliser l'analyse prédictive pour prendre des décisions avant-gardistes afin d'adapter le contenu à des segments d'audience uniques.
- Prévisions de maintenance :Les organisations utilisent les données pour prédire quand l’équipement aura besoin d’une maintenance de routine et peuvent ensuite planifier la maintenance à temps pour éviter les problèmes ou les pannes.
Références
【1】https://cloud.google.com/learn/what-is-predictive-analytics?hl=zh-cn