数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

许多企业已经在使用另一种集中式存储库:数据仓库。他们可能想知道他们是否需要一个数据湖,或者实施一个数据湖是否会取代现有的分析数据存储。但是数据仓库和数据湖是不同类型的存储库:它们具有不同的功能并用于不同的目的,尽管它们可以一起使用。数字化转型网www.szhzxw.cn
| 特征 | 数据仓库 | 数据湖 |
| 数据类型 | 在集成之前处理数据 | 数据以其原始和非结构化形式集成 |
| 用例 | 数据具有预先确定的用例 | 数据没有预先确定的用例 |
| 用户 | 企业用户 | 数据科学家 |
| 数据质量 | 数据经过整理并遵守数据治理实践 | 数据更敏捷,不一定符合治理指南 |
对比设计和数据结构
在高层次上,数据湖和仓库实现了不同的目标,并且基于截然不同的理念。数据仓库旨在作为复杂分析查询的稳定平台。默认情况下,它们是结构化的,因此它们可以支持在线分析处理 (OLAP) 等技术,重点是有效地解决查询。这一切都意味着首先对数据进行建模,然后将其集成到数据仓库中。
数据湖颠覆了这种范式——当用户使用存储的原始数据时,就会应用建模和模式。这允许更轻松地上传数据,并为用户提供运行不同类型分析以发现一系列见解的灵活性。数据湖分析的效率和速度取决于所使用的技术,而较少依赖于数据湖架构或设计。数字化转型网www.szhzxw.cn
未确定的用例与特定目的
“数据湖”一词用于描述集中式但灵活且非结构化的云存储。数据湖可以充当备份或归档数据的水库,但更重要的是,它可以成为自助分析平台。数据湖允许在没有预定目的的情况下将信息加载到存储中。
同时,数据仓库满足特定的业务需求或用户需求。它们是从头开始设计的,旨在解决这个特定问题,以后几乎没有适应性或分析即兴发挥的空间。数字化转型网www.szhzxw.cn
不同的用户和可访问性
数据湖包含原始数据并迎合整个企业的用户,但通常技术上更专业的用户将获得最大的价值。同时,数据仓库包含更多处理过的数据,预期以业务为中心的用户群和商业智能应用程序。
拥有处理大量非结构化数据的专业知识的数据科学家是数据湖的主要用户。然而,由于自助数据准备工具的出现,不太专业的用户也可以与非结构化数据进行交互。数据湖使从事数据发现或提出假设性问题的高级用户以及需要真实来源和访问未处理数据以供参考或验证的任何人都可以使用。
同时,业务分析师和技术水平较低的决策者可以更容易地使用预处理数据,例如数据仓库中的数据。来自仓库的数据由 BI 工具访问,并成为每日或每周报告、演示中的图表或电子表格中的简单汇总,呈现给高管。数字化转型网www.szhzxw.cn
敏捷性和分析与数据质量
数据湖和数据仓库都有助于分析;不同之处在于,在仓库中处理的数据具有预先确定的用例,而在数据湖中,其目的可能尚未确定。
虽然数据湖中的原始数据具有可塑性,这是敏捷分析和机器学习的理想选择,但其非结构化性质意味着对数据治理实践的遵守程度较低。在数据仓库中,用于组装和管理系统的业务流程可确保高质量数据并符合数据治理标准。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于CDO之家;编辑/翻译:数字化转型网Jack。








