您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
Hive的数据模型是怎样的?
数据模型,数据,数据存储Hive的数据模型是怎样的?
发布时间:2020-12-06加入收藏来源:互联网点击:
Hive的数据模型是怎样的?
回答于 2019-09-11 08:43:50
回答于 2019-09-11 08:43:50
Hive并不存储数据,Hive只是一个Sql解析工具
Hive的架构
hive的数据存储依赖于hadoop中的hdfs作为数据的存储源。并且Hive本身也没有计算引擎,也是依赖其他的计算引擎,如:mapreduce,spark,tez
回答于 2019-09-11 08:43:50
数据模型组成及应用场景
Hive的数据模型主要有:database、table、partition、bucket四部分;
数据模型之database
database:相当于关系型数据库中的命名空间,作用是将数据库应用隔离到不同的数据库模式中,hive提供了create database dbname、use dbname 以及drop database dbname的语句;
数据模型之table
table:表是由存储的数据以及描述表的一些元数据组成。数据存储再分布式文件系统中,元数据存储在关系型数据库中;
hive表分四种:
MANGED_TABLE :内部表
EXTERNAL_TABLE:外部表
INDEX_TABLE:索引表
VIRTUAL_VIEW :视图表
查看表的具体信息使用:desc tablename或者 desc formatted tablenameHive内部表和外部表的区别
数据模型之partition
hive的分区是根据某列的值进行粗略的划分,每个分区对应HDFS上的一个目录;
数据模型之bucket
要使用hive的分桶功能,首先需要打开hive对痛的控制 set hive.enforce.bucketing=true;
bucket是按照指定值进行hash,每个桶就是表目录里的一个文件
上一篇:如何面对忽冷忽热的水瓶座?
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |