データマイニングデータマイニング
データ マイニング (英語で DM) は、コンピューター サイエンスの学際的な分野です。これは、人工知能、機械学習、統計、データベースを組み合わせて、比較的大きなデータ セット内のパターンを発見する計算プロセスです。これは、大規模なデータセットを処理および調査するための分析に使用されるコンピューター支援技術です。データ マイニング ツールと手法の助けを借りて、組織はデータ内の隠れたパターンと関係を発見できます。データマイニングは、生データを実践的な知識に変換します。企業はこの知識を利用して問題を解決し、ビジネス上の意思決定が将来に与える影響を分析し、収益性を向上させることができます。データ マイニングの目的は、データそのものを抽出したりマイニングしたりすることではありません。むしろ、すでに大量のデータが存在しており、データマイニングはそこから有意義または貴重な知識を抽出する必要があります。
データマイニングの種類
データ マイニングには、データとマイニングの目的に応じて、さまざまなブランチや専門分野があります。データマイニングの例をいくつか紹介します。
プロセスマイニング
プロセス マイニングは、ビジネス プロセスの発見、監視、改善を目的としたデータ マイニングの一分野です。情報システムで利用可能なイベント ログから知識を抽出し、組織がこれらのプロセスで日常的に何が起こっているかを理解できるようにします。
たとえば、電子商取引ビジネスには、購入、販売、支払い、回収、発送などの多くのプロセスがあります。調達データのログを詳しく調べることで、サプライヤーの納入信頼性が 54% であること、または 12% のサプライヤーが常に予定より早く納入していることを発見する可能性があります。この情報を使用して、サプライヤーとの関係を最適化できます。
テキストマイニング
テキスト マイニングまたはテキスト データ マイニングでは、データ マイニング ソフトウェアを使用してテキストを読んで理解します。データ サイエンティストは、テキスト マイニングを通じて、Web サイト、書籍、電子メール、レビュー、記事などの文書ソースから知識を自動的に発見します。
たとえば、デジタル メディア企業はテキスト マイニングを使用して、オンライン ビデオのコメントを自動的に読み取り、視聴者のコメントを肯定的なコメントと否定的なコメントに分類できます。
予測マイニング
予測データ マイニングでは、ビジネス インテリジェンスを使用して傾向を予測します。これは、ビジネス リーダーが自分の決定が会社の将来に及ぼす影響を検討し、効果的な選択を行うのに役立ちます。
たとえば、企業は過去の製品返品データを調べて、損失を生じない保証を設計する場合があります。予測マイニングを使用して、来年の潜在的な返品の数を予測し、製品価格を決定する際に損失を考慮した 1 年間の保証計画を作成します。
参考文献
【1】https://zh.wikipedia.org/wiki/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98