数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

一、什么是数据挖掘?
数据挖掘是一种技术,例如可以基于对每个客户的深刻理解,在公司与客户之间形成长期良好关系的方法和策略。更具体地说可以说是分析公司收集的大量数据,发现有用的模式和规则,并支持营销活动的统计方法和工具的集合。数字化转型网www.szhzxw.cn
其中最经典的案例是啤酒与尿布的故事,通过关联规则销售。大多数人会认为这只是一个轶事,没有确凿的证据表明将两者放在同一楼层实际上会增加销售额。甚至有人会认为消费周期决定的,或者是一个偶然现象。
二、数据挖掘的2种方法是什么?
比较数据挖掘和统计分析的区别,数据挖掘是知识发现,统计分析是假设检验,但真的是这样吗?
统计分析处理的数据量比较少,数据挖掘可能更多。数据挖掘也有知识发现的成分,但不是通过输入数据就能自动发现的。应该认识到数据挖掘有两种类型:不仅是知识发现,还有假设检验,就像统计分析一样。
假设检验(面向目标) 数据挖掘有一个客观变量来预测购买量和客户反应,并据此对客户进行分类。回归分析、决策树和神经网络等许多技术都用于有目的地构建模型。数字化转型网www.szhzxw.cn
知识发现(探索性) 数据挖掘没有目标变量,试图从获得的数据中寻找有用的规则、模式、相似性等,作为一种典型的方法用于购物篮分析,属于关联分析。
在假设检验数据挖掘中,估计和理解是指估计和理解定量的数字,例如在什么地区销售什么样的产品,销售多少。分类提炼 是指将各个地区畅销的产品和产品类别进行提炼,分类整理后进行分析。这两个是为了正确识别当前的情况,但 预测 不是当前的情况,而是通过创建某种模型来预测未来的销量和畅销产品。
另一方面,知识启发式数据挖掘 关联规则制定 是探索性地同时知道买了什么和买了什么。 聚类 是指根据购买趋势等对相似的人进行分组,并尝试对每个组实施最佳措施。由于这两种方法没有目标变量,所以它们对应于多元分析中的汇总方法,但也不是没有目标的。
聚类和分类的区别在于分组依据是基于预定义的属性、购买金额等,还是分组基于事后定义的探索性依据。分位分析、RFM 分析等是对客户进行分组的类似方法,但基于预定义的标准,例如购买数量和频率。在聚类分析中,由于某种原因,分组是任意的,并且在事后进行分析以了解组的特征,因此方法完全不同。数字化转型网www.szhzxw.cn
文本挖掘 是一种具有代表性的 了解群体特征 的数据挖掘方法,用于假设检验和知识发现。文本挖掘可用于定性和定量地了解有目的所说的内容,或探索性地发现所说的内容。
这样就有了两种类型的数据挖掘:假设检验(面向目标)数据挖掘和知识发现(探索)数据挖掘。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于木木自由;编辑/翻译:数字化转型网Jack。

