数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

一、”自上而下”建立数仓(数仓→数据集市)
将不同的数据源,都整合到一个企业级的数仓里数字化转型网www.szhzxw.cn
(一)什么是”自上而下”建立数仓
自上而下建立数据仓库(DW-DM)又称为范式建模,之所以称为范式建模,是因为这种方式构建的数据仓库,信息存储是符合第三范式。为什么需要存储信息满足第三范式?因为所有的表都是先抽取到数仓里面,在进行维度建模。如果数据不满足第三范式的话,数据维度建模数据处理差,处理成本太大。
(二)”自上而下”建立数仓的优劣势分别有哪些
1、”自上而下”建立数仓的优势
企业对数据有一个真正的企业范围级的观察;
粒状的数据,可以满足不同分析角色的分析需求,支撑不同方式的分析过程;
能够从整体上把握数据仓库的规模、粒度的级别和元数据管理,是一种系统的解决方法;
易于维护,高度集成。
2、”自上而下”建立数仓的劣势
部署周期较长
投入的资源比较大
数据化建设的效果不能立刻展现;数字化转型网www.szhzxw.cn
结构死板,缺乏灵活性,因为整个组织的共同数据模型达到一致是很困难的。
(三)”自上而下”建立数仓的的适用场景
a.公司层面有大量资源投入和部门间协调推进能力,属于公司自上而下发起的数据建设;
b.对性能要求没那么高,可以接受查询性能的不足。
c.有一些更高层次的要求,要求底层数据的一致性,无数据冗余,方便维护等
二、“自下而上”建立数据仓库(维度建模)
(一)什么是“自下而上”建立数据仓库
别名:维度建模、维度数据仓库、总线体系结构、结构化数据集市、虚拟数据集市。维度建模源自数据集市,主要面向分析场景。维度建模是一种面向用户需求的、容易理解的、访问效率高的建模方法。维度建模通常以星型模式的方式构建,不过有时也会加入一些雪花模型在里面。
三大数据模型:星型模型、雪花模型、星座模型
(二)“自下而上”建立数据仓库的优劣势分别有哪些
1、“自下而上”建立数据仓库的优势
性能好,通过对各个维的预处理,能够极大地提升数据仓库的处理能力;
比较直观,不需要经过特别的抽象处理即可完成维度建模,通过紧紧围绕业务模型,可直观地反映出业务模型中的业务问题;
灵活性,花费低,能够得到快速的投资回报。
2、“自下而上”建立数据仓库的劣势
数据孤岛现象。不能保证各个数据集市数据来源的一致性和准确性数字化转型网www.szhzxw.cn
数据抽取负担。当数据集市数量庞大时,抽取原始数据的负担会比较大;
变更不可传递。当多个数据集市需要做一些相关或类似的变更时,需要在多个数据集市都要做一遍,会增加工作量和出错率;
缺乏扩展性。当需要建立一个新的数据集市是可能还要从头建起。
(三)“自下而上”建立数据仓库的适用场景
a.追求卓越的性能,希望能够有快速的查询和计算能力;
b.希望数据建设项目快速上线,短期内不希望有大量的投入;
c.能够接受后续比较高的维护成本,以及维度建模长期发展的一些劣势:数据孤岛、数据抽取负担、变更不可传递、缺乏扩展性的缺点。数字化转型网www.szhzxw.cn
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于 数据集成与治理;编辑/翻译:数字化转型网Jack。








