数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

一、开发和提升数据质量意识
尤其强调了将数据质量问题和实质影响联系起来,包括数据质量问题不能仅仅依靠技术手段解决的理念,然后提供一些基础培训、建立数据质量管理委员会,提升参与意识,强调个人绩效,数据需求分析要纳入到整个系统开发周期等等;这一点是数据质量管理的基础和成败的关键,但也往往是企业的痛点,首先高层知道数据质量的重要性,但业务系统的建设和稳定性才是推动企业发展的重点,对数据质量的重视往往停留在口头上;信息化部门的执行力由于缺乏上层的支持,对其他业务部门的协调力度不够,毕竟数据质量是要做大量的沟通协调工作,甚至需要对业务系统进行完善和修订,而往往经费仅限定于数据质量平台,未考虑其他费用;数据质量平台做了大量的基础工作、规则收集、脚本验证、生成报告,有了闭环流程,由于少了业务部门、业务厂家的参与,却起不到应有的作用,于是年复一年日复一日,各方都对数据质量管理产生了怀疑。如何破局呢?一是给高层洗脑,二是要对企业信息化水平现状有足够的认知,三是提供合理的方案,四是全方位联动,但代价太高,又会导致诟病。数字化转型网www.szhzxw.cn
二、定义数据质量需求
数据质量必须在适用性背景下被理解,要遵从外部的管理法规、行业标准和内部的市场、销售、物流等业务规则;数据质量维度包括准确性、完整性、一致性、合理性、参照完整性、及时性、唯一性、有效性、精确度、隐私、时效性;在DAMA里数据质量维度定义的非常全面,强调了时效性和隐私,而且把准确性和一致性做了区分,又对一致性做了记录级一致性、跨记录一致性、时间一致性等细分。这是数据质量管理中应该加强的。
三、剖析、分析和评估数据质量
自下而上是基于自动流程的处理结果,强调潜在问题,包括出现率分析、重复性分析、跨数据集的依赖关系、孤儿数据记录和冗余分析。
自上而下,用户参与记录业务流程和关键数据的依赖关系,需要理解业务流程如何使用数据,哪些数据元素对于业务应用的成功至关重要。记录填充率,频繁值、异常值、字段关系、跨表关系、属性填充值。
一般在评估和分析数据质量采用两者融合的方式进行的,自下而上可以基于元数据、血缘关系等进行量化分析的方式获得,以框定数据质量管理的实施范围;自上而下版来自业务部门的需求,毕竟最熟悉业务的还是业务人员,业务人员对数据质量的需求是第一手需求。数字化转型网www.szhzxw.cn
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于 python与大数据分析;编辑/翻译:数字化转型网Jack。








