数据挖掘 Data Mining
数据挖掘(英语是 Data Mining,简称 DM)是一个跨学科计算机科学分支。它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。它是一种计算机辅助技术,用于分析以处理和探索大型数据集。借助数据挖掘工具和方法,组织可以发现其数据中隐藏的模式和关系。数据挖掘将原始数据转化为实用的知识。公司可以利用这些知识来解决问题、分析业务决策对未来的影响以及提高利润率。数据挖掘的目标不是提取或挖掘数据本身。而是已经有了大量数据,数据挖掘要从中提取有意义或有价值的知识。
数据挖掘的类型
根据数据和挖掘的目的,数据挖掘可以有不同的分支或专业。以下是一些数据挖掘的示例。
流程挖掘
流程挖掘是数据挖掘的一个分支,旨在发现、监控和改进业务流程。它从信息系统中可用的事件日志中提取知识,帮助组织了解这些流程中每天发生的事情。
例如,电子商务企业有许多流程,如采购、销售、付款、收款和发货。通过挖掘采购数据日志,他们可能会发现其供应商交付可靠性为 54%,或有 12% 的供应商始终提前交付。他们可以利用这些信息优化与供应商的关系。
文本挖掘
文本挖掘或文本数据挖掘使用数据挖掘软件来阅读和理解文本。数据科学家通过文本挖掘自动发现书面资源中的知识,如网站、书籍、电子邮件、评论和文章。
例如,数字媒体公司可以借助文本挖掘自动读取其在线视频上的评论,并将观众评论分为正面和负面。
预测挖掘
预测数据挖掘使用商业智能来预测趋势。它可以帮助企业领导者研究其决策对公司未来的影响并做出有效的选择。
例如,公司可能会查看过去的产品退货数据,设计不会导致损失的保修方案。利用预测挖掘,他们会预测未来一年的潜在退货数量,并在确定产品价格时制定考虑到损失的一年保修计划。
参考来源
【1】https://zh.wikipedia.org/wiki/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98