数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

数据挖掘的一个特点是处理的数据量大于统计分析处理的数据量,但与统计分析处理的数据还有其他决定性的差异。统计分析所用的数据,不仅干净,浪费少,而且和一个经过合理规划、树木密布、果实几乎可以肯定成熟的果园一样。
比如在调查数据中,数百个问题的答案数据几乎全部被量表分成5级评分并进行是否的1/0数据填充,NULL(无值)的数据。数字化转型网www.szhzxw.cn
数据挖掘处理的数据是数以万计的产品中购买了几种产品的数百万客户的数据毫不夸张地说大部分数据为NULL。
当数据多数被NULL充满变得稀疏时,称为稀疏数据,构建数据矩阵被称为稀疏矩阵。在数据挖掘中,数据的这种稀疏性是一个大问题。有必要从产品分析和客户分析两方面来解决稀疏问题。
在产品分析中,按SKU(Stock Keeping Unit)分析数以万计的产品,无非是造成数据稀疏的因素。为此品类分析在CTB(Customer to Business)分析中显得尤为重要。另外评价客户相似度时的相似度定义可能无法通过传统的聚类分析处理,因此需要对其进行设计。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于木木自由;编辑/翻译:数字化转型网Jack。

