予測分析予測分析

予測分析は、データを使用して将来の結果を予測するプロセスです。このプロセスでは、データ分析、機械学習、人工知能、統計モデルを使用して、将来の行動を予測する可能性のあるパターンを見つけます。組織は過去のデータと現在のデータを使用して、数秒、数日、または数年先の傾向と行動を高い精度で予測できます。

予測分析の仕組み

データ サイエンティストは、予測モデルを使用して、選択したデータ セット内のさまざまな要素間の相関関係を特定します。データ収集が完了すると、予測を生成するために統計モデルが定式化、トレーニング、および変更されます。

予測分析フレームワークを構築するワークフローは、次の 5 つの基本的な手順で構成されます。

  1. 定義の問題: 予測は、優れた論文と一連の要件から始まります。たとえば、予測分析モデルは不正行為を検出できるでしょうか?ホリデー ショッピング シーズンに最適な在庫レベルを判断できますか?悪天候によって引き起こされる可能性のある洪水レベルを決定することはできますか?明確な質問に答えることは、どの予測分析アプローチを使用するかを決定するのに役立ちます。
  2. データの取得と整理: 組織には、何十年にもわたって蓄積されたデータ、または顧客とのやり取りによって生成されたデータの安定した流れがある場合があります。予測分析モデルを開発する前に、データ フローを特定し、データ セットをリポジトリに編成する必要があります。
  3. データの前処理: 生データ自体は名目上のみ役に立ちます。予測分析モデル用のデータを準備するには、データをクリーンアップして、入力または測定エラーの結果である可能性のある外れ値、欠落したデータ ポイント、または極端な外れ値を除去する必要があります。
  4. 予測モデルの開発: データ サイエンティストは、解決すべき問題とデータ セットの性質に応じて、さまざまなツールやテクニックを利用して予測モデルを開発できます。機械学習、回帰モデル、デシジョン ツリーは、最も一般的なタイプの予測モデルです。
  5. 結果を検証して展開する: モデルの精度を確認し、それに応じて調整します。許容可能な結果が得られると、アプリ、Web サイト、またはデータセンターを介して関係者がその結果を利用できるようになります。

予測分析手法

一般に、予測モデルには分類モデルと回帰モデルの 2 種類があります。分類モデルは、顧客や潜在的な結果などのデータ オブジェクトをカテゴリに分類しようとします。たとえば、小売業者がさまざまなタイプの顧客に関する大量のデータを持っている場合、どのタイプの顧客がマーケティング電子メールを喜んで受信するかを予測しようとする可能性があります。回帰モデルは、顧客が企業との関係中にどれだけの収益をもたらすかなどの継続的なデータを予測しようとします。

予測分析は通常、次の 3 つの主要な分析方法を使用して実行されます。

  • 回帰分析: 回帰は、変数間の関係を推定するために使用される統計分析手法です。回帰を使用すると、大規模なデータセット内のパターンを識別し、入力間の相関関係を判断できます。この方法は、既知の分布に従う連続データで最も効果的です。回帰は、1 つ以上の独立変数が別の独立変数にどのような影響を与えるかを判断するためによく使用されます (たとえば、価格上昇が商品の販売数にどのような影響を与えるかなど)。
  • デシジョンツリー: デシジョン ツリーは、さまざまな変数に基づいてデータをさまざまなカテゴリに分類する分類モデルです。この方法は、個人の意思決定を理解するのに最適です。モデルはツリーのように見え、各枝は可能な選択肢を表し、枝の葉は決定の結果を表します。デシジョン ツリーは一般に理解しやすく、データ セットにいくつかの変数が欠落している場合に適切に機能します。
  • ニューラルネットワーク: ニューラル ネットワークは、非常に複雑な関係をモデル化する際の予測分析に非常に役立つ機械学習手法です。本質的に、これらは強力なパターン認識エンジンです。ニューラル ネットワークは、特にデータを分析するための既知の数式がない場合に、データ セット内の非線形関係を判断するのに最適です。ニューラル ネットワークは、デシジョン ツリーと回帰モデルの結果を検証するために使用できます。

予測分析の使用法と例

予測分析を使用すると、銀行、小売、公益事業、公共部門、ヘルスケア、製造など、事実上あらゆるビジネスや業界の業務を合理化し、収益を増やし、リスクを軽減できます。場合によっては、ビッグデータの機械学習を活用する拡張分析も使用されます。その他の使用シナリオは次のとおりです。

  • 不正行為の検出:予測分析は、企業のネットワーク内のすべての操作をリアルタイムで検査し、不正行為やその他の脆弱性につながる異常を特定します。
  • コンバージョンと購入の予測:企業は、オンライン広告で訪問者のターゲティングを変更したり、データを使用してどの訪問者がコンバージョンにつながり、購入意向を持つ可能性が高いかを予測するなど、いくつかの措置を講じることができます。
  • リスクを軽減します:信用スコア、保険金請求、債権回収はすべて予測分析を使用して、将来の債務不履行の可能性を評価および判断できます。
  • 運用上の改善:企業は予測分析モデルを使用して、在庫を予測し、リソースを管理し、業務効率を向上させます。
  • 顧客のセグメンテーション: 顧客ベースを特定のセグメントに分割することで、マーケティング担当者は予測分析を使用して、コンテンツを固有の視聴者に合わせて調整するための前向きな意思決定を行うことができます。
  • メンテナンス予測:組織はデータを使用して機器の定期メンテナンスがいつ必要になるかを予測し、問題や障害を回避するために適時にメンテナンスをスケジュールします。

参考文献

【1】https://cloud.google.com/learn/what-is-predictive-analytics?hl=zh-cn