您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页Hive的数据模型及各模块的应用场景

Hive的数据模型及各模块的应用场景

来源:意榕旅游网
Hive的数据模型及各模块的应⽤场景

Hive的数据模型

Hive数据模型.png

数据模型组成及应⽤场景

Hive的数据模型主要有:database、table、partition、bucket四部分;数据模型之database

database:相当于关系型数据库中的命名空间,作⽤是将数据库应⽤隔离到不同的数据库模式中,hive提供了create databasedbname、use dbname 以及drop database dbname的语句;数据模型之table

table:表是由存储的数据以及描述表的⼀些元数据组成。数据存储再分布式⽂件系统中,元数据存储在关系型数据库中;hive表分四种:

MANGED_TABLE :内部表EXTERNAL_TABLE:外部表INDEX_TABLE:索引表VIRTUAL_VIEW :视图表

查看表的具体信息使⽤:desc tablename或者 desc formatted tablenameHive内部表和外部表的区别

数据模型之partition

hive的分区是根据某列的值进⾏粗略的划分,每个分区对应HDFS上的⼀个⽬录;数据模型之bucket

要使⽤hive的分桶功能,⾸先需要打开hive对痛的控制 set hive.enforce.bucketing=true;bucket是按照指定值进⾏hash,每个桶就是表⽬录⾥的⼀个⽂件

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务