数据模型

数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

数据引入层(ODS)

ODS层存放您从业务系统获取的最原始的数据,是其他上层数据的源数据。业务数据系统中的数据通常为非常细节的数据,经过长时间累积,且访问频率很高,是面向应用的数据。

数据引入层表设计

本教程中,在ODS层主要包括的数据有:交易系统订单详情、用户信息详情、商品详情等。这些数据未经处理,是最原始的数据。逻辑上,这些数据都是以二维表的形式存储。虽然严格的说ODS层不属于数仓建模的范畴,但是合理的规划ODS层并做好数据同步也非常重要。本教程中,使用了6张ODS表:

记录用于拍卖的商品信息:s_auction。

记录用于正常售卖的商品信息:s_sale。

记录用户详细信息:s_users_extra。

记录新增的商品成交订单信息:s_biz_order_delta。

记录新增的物流订单信息:s_logistics_order_delta。

记录新增的支付订单信息:s_pay_order_delta。

说明

表或字段命名尽量和业务系统保持一致,但是需要通过额外的标识来区分增量和全量表。例如,我们通过_delta来标识该表为增量表。数字化转型网www.szhzxw.cn

命名时需要特别注意冲突处理,例如不同业务系统的表可能是同一个名称。为区分两个不同的表,您可以将这两个同名表的来源数据库名称作为后缀或前缀。例如,表中某些字段的名称刚好和关键字重名了,可以通过添加_col1后缀解决。

建表示例

提供建表语句示例如下。

CREATE TABLE IF NOT EXISTS s_sale
(
id STRING COMMENT ‘商品ID’,
title STRING COMMENT ‘商品名’,
gmt_modified STRING COMMENT ‘商品最后修改日期’,
starts STRING COMMENT ‘商品上架时间’,
price DOUBLE COMMENT ‘商品价格,单位元’,
city STRING COMMENT ‘商品所在城市’,
prov STRING COMMENT ‘商品所在省份’,
quantity BIGINT COMMENT ‘数量’,
stuff_status BIGINT COMMENT ‘商品新旧程度 0 全新 1 闲置 2 二手’,
auction_status BIGINT COMMENT ‘商品状态 0 正常 1 用户删除 2 下架 3 从未上架’,
cate_id BIGINT COMMENT ‘商品类目ID’,
cate_name STRING COMMENT ‘商品类目名称’,
commodity_id BIGINT COMMENT ‘品类ID’,
commodity_name STRING COMMENT ‘品类名称’,
umid STRING COMMENT ‘买家umid’
)
COMMENT ‘商品正常购买ODS’
PARTITIONED BY (ds STRING COMMENT ‘格式:YYYYMMDD’)
LIFECYCLE 400;

CREATE TABLE IF NOT EXISTS s_biz_order_delta
(
biz_order_id STRING COMMENT ‘订单ID’,
pay_order_id STRING COMMENT ‘支付订单ID’,
logistics_order_id STRING COMMENT ‘物流订单ID’,
buyer_nick STRING COMMENT ‘买家昵称’,
buyer_id STRING COMMENT ‘买家ID’,
seller_nick STRING COMMENT ‘卖家昵称’,
seller_id STRING COMMENT ‘卖家ID’,
auction_id STRING COMMENT ‘商品ID’,
auction_title STRING COMMENT ‘商品标题 ‘,
auction_price DOUBLE COMMENT ‘商品价格’,
buy_amount BIGINT COMMENT ‘购买数量’,
buy_fee BIGINT COMMENT ‘购买金额’,
pay_status BIGINT COMMENT ‘支付状态 1 未付款 2 已付款 3 已退款’,
logistics_id BIGINT COMMENT ‘物流订单ID’,
mord_cod_status BIGINT COMMENT ‘物流状态 0 初始状态 1 接单成功 2 接单超时3 揽收成功 4揽收失败 5 签收成功 6 签收失败 7 用户取消物流订单’,
status BIGINT COMMENT ‘状态 0 订单正常 1 订单不可见’,
sub_biz_type BIGINT COMMENT ‘业务类型 1 拍卖 2 购买’,
end_time STRING COMMENT ‘交易结束时间’,
shop_id BIGINT COMMENT ‘店铺ID’
)
COMMENT ‘交易成功订单日增量表’
PARTITIONED BY (ds STRING COMMENT ‘yyyymmdd’)
LIFECYCLE 7200;

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

数字化转型网数据专题包含哪些内容

数字化转型网数据专题将关注数据治理、数据质量管理、数据架构、主数据管理、数据仓库、元数据管理、数据备份、数据挖掘、数据分析、数据安全、大数据、数据合规、等数据相关全产业链相关环节。

数字化转型网数据专题包含: 数字化转型网(www.szhzxw.cn)

1、数据相关外脑支持:100+数据相关专家、100+数据实践者、1000+相关资料

2、数据研习社:与全球数据相关专家、实践者共同探讨相关问题,推动产业发展!

3、国际认证培训:目前已引进DAMA国际认证CDMP,其他国内外认证也在逐步引进中

4、典型案例参考:与数字化转型网数据要素X研习社社员一起学习典型案例,共探企业数据落地应用

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于 数据仓库与Python大数据;编辑/翻译:数字化转型网Jack。

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。http://www.szhzxw.cn/61901.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部