数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

接下来,我们说说数据挖掘。很多人会问,数据挖掘能够做什么?
有一个很多数据挖掘书籍都会提到的经典案例:数字化转型网www.szhzxw.cn
“尿布与啤酒”的故事。在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意外的发现是:”跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在”尿布与啤酒”背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。按常规思维,尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内在这一有价值的规律的。
看到没,这就是数据挖掘,从常人的知识外找到线索。通俗说,数据挖掘可以做到以下几点:
1、 找到没有意识到的问题
2、 找到未来发展的趋势
3、 找到过去存在的问题
4、 把定性的问题定量化
5、 数据对象关联的规则问题数字化转型网www.szhzxw.cn
这五块能够产生的效应,我就不用废话了吧?
当然还有能挖出其他一些隐藏的资料。比如最近我们做的一项全网数据挖掘,就是通过对新浪、阿里巴巴、淘宝等十余个网站做关联数据分析,整理出了近3000万个微信账号和手机号码的对应数据包出来了。
这里顺便说到我们自己的数据挖掘,我们的数据挖掘最初其实是从找名人八卦来的,很多人只知道我是去年王石等地产三剑客事件的策划者,可是他们没想到的是,我这边是通过对新浪微博的数据分析中知道王石和田朴珺关系密切,然后通过其他方式确定的。我们曾经从新浪微博的数据分析中知道了一堆名人和他们关系暧昧的女粉丝(姑且这么叫)的消息,比如某某大V喜欢情趣内衣的事情也知道!
在实践中,数据挖掘有两类:
第一类是面向宏观规律的数据挖掘,所谓面向宏观规律,就是从一堆数据中,通过一定的数据分析方法,得出一个综合性的知识结论。举例来说,一个网站的宏观数据等。比如淘宝可以知道哪些款式是所谓的爆款等
第二类是面向微观规律的数据挖掘,所谓面向微观规律,就是从一堆数据中,通过一定的数学方法,找出单个或者部分个体的有关知识结论。比如单个用户的未来发展等。比如可以知道某个用户可能的购买商品等。数字化转型网www.szhzxw.cn
就目前的学术界而言,面向微观的数据挖掘理论,基本上是空白。面向宏观规律的,更多只需要凭的统计学知识就可以解决。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于泰迪学社;编辑/翻译:数字化转型网Jack。

