2-dw_事实表、维度表
事实表:记录公司的一笔正常的业务数据,需要提供 4W ,什么时候 (When) 在什么地方 (Where) 有哪些人 (Who) 做了什么事 (What) 。为了方便后续分析,在设计事实表的时候,我们应该尽可能的提供详细的维度信息和度量信息。
比如我们在谈一家物流公司的数据仓库的时候,如何去设计落地一个事实表,我们按以下过程来落地。
1 :用户的目的:首先我们需要知道用户的目的,以价值为导向,解决用户的问题,这时用户会提出,目前公司营运成本太高,今年需要节省多少费用。
2 :定义指标:针对上面的目标,我们需要与用户一起来分析这个目标,可以用哪些指标来衡量这个目标往预期方向走,也就是我们所说的拆分目标,这个过程会多次沟通,反复的拆分和合并之前定义的指标,比如说最终我们统一认定有装载率、车辆营运公里数、单公斤成本,单公里成本这 4 个指标。
3 :指标细分:指标确认后,我们就需要细分指标数据 ( 多级指标 ) ,比如装载率这个指标,我们是否需要针对业务场景,区分早、中、晚时段的装载情况,不同车型 (5KG,10KG) 的装载率情况,对于单公斤成本和单公里成本我们是否需要清楚知道成本的费用项,比如司机成本、油费成本、车辆折旧成本等。
4 :定义相关字段和逻辑:有了以上细分指标的确定,接下来我们只与用户确认各个指标的逻辑和取数口径了, 设计好事实表的字段,验证是否满足用户的目的数据应用,假如有如下系统,我们对每个事实表字段确认源系统和后台表字段关系。
a :车辆调度系统:什么时候哪个车跑了哪条线。
b :结算系统:每次车的费用是多少。
c :装载系统:每个车每个线路的业务量信息。
5 :有了这些指标后我们快速实现和落地,提供一些分析报告,对前端业务做些改进方案,再来验证我们的指标是否往好的方向改变,同时成本也在降低,哪么我们整个方案和指标定义的非常好,如果指标在往好的方向改变,但成本并没有降低,哪么我们就要重新来定义某些指标是否正确了,就这样的一直迭代直到我们达到用户的目标。
维度表:是对事实表里的维度进行扩展更详细的信息补充。我们在定义一个维度表的时候,需要怎样设计呢?比如在事实表里有客户这样的一个维度,我们与用户沟通在他们来看客户这个维度主要关心的是哪些信息,达到什么样的目的,用户一般会想达到用户差异化的管理和销售,哪么我们就要抓住如何来区分客户的差异化的信息:
1 :基本属性:比如像客户规模( 1 千人、 1 万人)、地域(深圳、广州等)、行业(制造、互联网等)。
2 :按客户行为:层级(大客户、散客等)、销售量( 0-100 , 101-500 , 501-1000 等)。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341