Hive的数据模型
Hive数据模型.png
数据模型组成及应⽤场景
Hive的数据模型主要有:database、table、partition、bucket四部分;数据模型之database
database:相当于关系型数据库中的命名空间,作⽤是将数据库应⽤隔离到不同的数据库模式中,hive提供了create databasedbname、use dbname 以及drop database dbname的语句;数据模型之table
table:表是由存储的数据以及描述表的⼀些元数据组成。数据存储再分布式⽂件系统中,元数据存储在关系型数据库中;hive表分四种:
MANGED_TABLE :内部表EXTERNAL_TABLE:外部表INDEX_TABLE:索引表VIRTUAL_VIEW :视图表
查看表的具体信息使⽤:desc tablename或者 desc formatted tablenameHive内部表和外部表的区别
数据模型之partition
hive的分区是根据某列的值进⾏粗略的划分,每个分区对应HDFS上的⼀个⽬录;数据模型之bucket
要使⽤hive的分桶功能,⾸先需要打开hive对痛的控制 set hive.enforce.bucketing=true;bucket是按照指定值进⾏hash,每个桶就是表⽬录⾥的⼀个⽂件
因篇幅问题不能全部显示,请点此查看更多更全内容