数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

一、目的明确:
在数据挖掘中,虽然没有目的,但你不太可能会尝试通过将暂时存在的数据投入其中来获得一些知识。知识发现(探索)数据挖掘并非没有目的。首先,了解要解决的问题,明确目的。
二、分析策略的确定:
为了达到这个目标首先要仔细查看数据,了解其内容,然后制定政策,使用哪些数据,使用哪些分析方法和工具。此外,一次尝试无法找到最优的分析策略,如果分析结果不理想,则可能会修改策略并重复多次循环。
三、数据清洗、数据处理/整形:
正如开头所说,最好认为收集到的数据总是夹杂着不必要的数据。数据重复和丢失数据,不应该处理的数据污染,异常值和异常值,这些垃圾数据必须被提取和排除。还要了解它是什么数据,把数据标准化,格式化成分析软件可以处理的形式。数字化转型网www.szhzxw.cn
四、基本聚合:
在进行认真的分析之前,需要对数据进行鸟瞰。有必要通过计算基本统计量和进行交叉制表来减少构成要解决问题的基础的数值。为了进行分析,了解要分析的问题很重要,基本聚合可以更准确地了解当前情况。
五、多元分析:
根据分析策略的结果,选择回归分析、聚类分析、关联分析等方法。即使在同一个回归分析中,也需要选择是简单回归分析、多元回归分析还是量化类型。在聚类分析的情况下,使用哪种距离定义,在关联分析中,使用哪种关联分析你必须决定是否使用逻辑。最重要的是,提取、分类和发现有用的知识。
六、模型创建:
根据多变量分析的结果,概括规则并创建模型,当获取新数据时,该模型可以用某种算法解决问题。该模型的适用性通过将其应用于实际数据来验证。如果不合适或预测准确率低,可能需要调整模型或审查模型本身,这就是为什么说数据挖掘是一个不断试错的过程。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于木木自由;编辑/翻译:数字化转型网Jack。

