共计 659 个字符,预计需要花费 2 分钟才能阅读完成。
数据库的基本操作很多都是相差不大,从mysql到hive,基本上大部分语法都是相同的,除了一部分本质上的差异,其他语法可以通用,今天就先学习下hive数据表的创建
CREATE TABLE pokes (foo INT, bar STRING);
hive> CREATE TABLE pokes (foo INT, bar STRING);
OK
Time taken: 2.053 seconds
hive> show tables;
OK
pokes
Time taken: 0.115 seconds, Fetched: 1 row(s)
到此我们就创建了一个数据表pokes,hive还可以创建带有分区的数据表,何为分区的概念?
分区指的是在创建表时指定的partition的分区空间,可以理解为把表的数据分成一块一块的,假设我们使用时间作为分区的依据,也就是每天我们都会产生相应的分区数据,到时候我们想查某一天的数据,直接去查那个分区的数据即可,不需要去遍历整个数据库去查询,这样的话查询的速度会快很多。
分区先关的技术
1、一个表可以拥有一个或者多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下。
2、表和列名不区分大小写。
3、分区是以字段的形式在表结构中存在,通过describe table命令可以查看到字段存在,但是该字段不存放实际的数据内容,仅仅是分区的表示。
下面我们就创建一个带有分区的数据表
CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (year STRING,month STRING,day STRING);
正文完
请博主喝杯咖啡吧!