数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

当下一提到数据挖掘等,很多人就提到算法了、统计了等等,其实凡是这样想的,都没理解真谛。我常常对我手下的技术人员说,统计学是一名形象学科,每一个数据都代表了现实的一种状态。不要把数理统计搞成了纯粹的抽象数学。我个人一直认为数据挖掘其实是个社会学问题,而不是统计学的。国内目前的研究过多注意在数学方法上。如果没有社会学方面的支持,看到的统计结果只是一堆数据。一个有行业经验的分析师,能够从同样的数据结果中看到更多的东西,也能对同一堆数据设计出更多的数学分析过程。
新浪微博网友马继华这样说过:应该说,现在越来越质疑被吹得天花乱坠的阿里巴巴数据分析能力,特别是对于用户消费的推荐,跟踪了几个月,没有发现一个推荐是对的。那些垃圾推荐要不就是让你后悔,就是让你好笑。这样的推荐还不如没有,看来任何数据分析神话都是靠不住的,还是相信自己的脑袋吧。
微博上有网友发了条微博:“自从上周准备在淘宝买一只电饭煲搜了一会儿,这些天每天打开微博就是各种各样的锅锅煲煲,拜托了,请问谁家会连着买一只以上的电饭煲来?不过想起有个手贱的朋友说过,一次出于好奇曾经在淘宝搜过有没有卖骨灰盒的,结果。。。想想这个我觉得还挺庆幸的。”这里的骨灰盒是网上的一则真实的笑话,说的是有个网友在淘宝上搜索了下骨灰盒,然后他访问新浪微博的时候,右侧的淘宝广告位天天给他推荐骨灰盒。
我曾经发微博说过淘宝的数据分析是理科的:“很多用户反应,在淘宝上买了T恤,然后一登录微博,整天看到都是T恤广告。用户买了蒸锅,结果天天推蒸锅。这种说明淘宝只做了简单的数据同类推送,而忽略了非技术层面的关系,比如买过T恤的你应该推裤子,买蒸锅的应该推荐速冻包子,买了奶粉的你应该推荐尿不湿。”
实际上中国的数据挖掘,往往还会遇到一个汉语语义问题,比如市面上的微博监控分析软件,要么只是通过关键词去检索,然后做出傻瓜化的回复。典型的例子就是几个月前,新浪上李开复的微博闹出个笑话,有网友发现,只要在他的博下留言中含有问好的字样,李开复的微博就自动设置回复感谢你三个字。结果一堆恶作剧的网友把李开复的十八代祖宗都问候了过遍,几个小时后,李开复这边才关闭掉这个自动回复。数字化转型网www.szhzxw.cn
现在很多人谈大数据,谈数据挖掘,却忽略数据挖掘不过是知识发现体系的一个组成部分,一个良好的知识发现体系,必须先建立一个完善的知识发现模型,目前国内数据分析本身就走入了一个误区,重数据,轻建模;重技术,轻人文。一个好的数据分析体系,首先得有一个良好的理论模型,用它去指导分析,然后通过数据不断修正它,任何把数据分析当数学和代码来搞的最后肯定闹笑话。
看了一些数据分析软件,感觉这些提供方都不明白什么是数据挖掘。他们以为提供套能够查询数据库、把查询结果图表化,就可以了。我要说,您这是统计分析软件。数据挖掘是无法淡单独提出来做啥用的,它只是在领域专家背景下知识发现过程中的技术,这个世界没有一款能跨行业、跨事务的通用数据分析软件。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于泰迪学社;编辑/翻译:数字化转型网Jack。

