数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

一、什么是Lambda架构?
为了进一步满足企业对实时数据的需求,Lambda架构被提出。
Lambda架构通过结合离线计算和实时计算两种方式,Lambda架构能够实现对实时数据的快速响应的同时,保证数据的准确性和全面性。数字化转型网www.szhzxw.cn
二、Lambda架构的三层结构及功能
三层结构及功能:
1、批处理层(Batch Layer):
· 数据存储与管理:负责存储和管理主数据集。主数据集具有原始、不可变且永远真实的属性,是后续数据处理的基础。
· 预先批处理计算:预先对数据进行批处理计算,生成批处理视图(Batch Views)。批处理的时间间隔可根据不同业务需求设置,通过处理所有的历史数据来保证数据的准确性,能够修复错误并更新现有的数据视图。批处理层擅长处理大规模的离线数据,适用于对数据准确性要求高、对实时性要求不那么高的场景,例如历史数据的统计分析、长期趋势的预测等。
2、速度处理层(Speed Layer):
· 实时数据处理:实时处理新来的大数据,对增量数据进行快速计算。速度层能够在数据到达后立即进行处理,生成实时视图(Real-time Views),最小化数据处理的延迟。它所生成的数据视图可能不如批处理层最终生成的视图那样准确或完整,但具有很高的实时性。
· 数据更新与补充:速度层不断接收新数据并更新实时视图,弥补了批处理层在数据处理过程中产生的延迟。例如,在批处理层的任务尚未完成的时间段内,速度层可以提供最新的数据视图,让用户能够及时获取到最新的数据信息。数字化转型网www.szhzxw.cn
3、服务层(Serving Layer):
· 结果合并与查询响应:用于合并批处理层和速度层的结果,对外提供统一的数据查询接口,响应用户的查询请求。当用户发起查询时,服务层会根据查询的需求,从批处理层获取准确的历史数据视图,从速度层获取实时的数据视图,并将两者进行合并,返回给用户一个完整的查询结果。
三、Lambda架构的主要优势
1. 容错性好:如果系统出现错误,可以通过修复算法或从头开始重新计算视图。并且速度层中处理的数据不断写入批处理层,当批处理层重新计算时可以修正速度层引入的错误,具有较高的容错能力。
2. 查询灵活度高:批处理层允许针对任何数据进行临时查询,能够满足用户多样化的查询需求。
3. 易伸缩:所有的批处理层、速度处理层和服务层都是完全分布式的系统,可以通过增加新机器来轻松地扩大规模,具有良好的可扩展性。数字化转型网www.szhzxw.cn
4. 易扩展:添加新的视图相对容易,只需给主数据集添加几个新的函数即可,方便系统功能的扩展和升级。
四、Lambda架构的缺点
Lambda 架构也存在一些缺点,比如开发和维护的复杂性较高,需要维护两套不同的代码(批处理和实时处理),且存在数据口径不一致的风险等。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn
数字化转型网数据专题包含哪些内容
数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。
数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)
1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料
2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!
3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中
4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于 数据集成与治理;编辑/翻译:数字化转型网Jack。








