您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
hive数据仓库的设计,项目中分了几层,每层有什么意义?
维度,组合,事实hive数据仓库的设计,项目中分了几层,每层有什么意义?
发布时间:2020-12-06加入收藏来源:互联网点击:
hive数据仓库的设计,项目中分了几层,每层有什么意义?
回答于 2019-09-11 08:43:50
回答于 2019-09-11 08:43:50
数据仓库的设计,建议看一看Kimball的维度模型设计的相关书籍。
一般来说,数据仓库会包含维度表,事实表,以及相关的汇总结果,通常以cube形式存在的多维分析的结果集。
维度表是指用来看数据的不同划分角度,如按时间查看,按城市查看等等,这里的时间,城市等就是维度,数据仓库里一般会对这些数据单独管理,形成维度表,同时针对维度表的变化,有些对应的不同处理方案。事实表则存储了按维度划分的度量指标的记录,如记录不同时间,不同城市的销售额的表,这其中的销售额就是一种度量,可以按照时间,城市等维度进行划分,同时也可以聚合汇总。
对数据进行了维度与事实的划分后,就可以根据需求,按不同的维度组合进行事实表的查询。cube一般会按既定的维度组合进行预计算,并将各维度组合的值存储下来,以备直接查询。
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |