hive专题（1）-数据表创建

4,067次阅读

共计 659 个字符，预计需要花费 2 分钟才能阅读完成。

数据库的基本操作很多都是相差不大，从mysql到hive，基本上大部分语法都是相同的，除了一部分本质上的差异，其他语法可以通用，今天就先学习下hive数据表的创建

CREATE TABLE pokes (foo INT, bar STRING);

hive> CREATE TABLE pokes (foo INT, bar STRING);OK
Time taken: 2.053 seconds
hive> show tables;
OK
pokes
Time taken: 0.115 seconds, Fetched: 1 row(s)

到此我们就创建了一个数据表pokes，hive还可以创建带有分区的数据表，何为分区的概念？

分区指的是在创建表时指定的partition的分区空间，可以理解为把表的数据分成一块一块的，假设我们使用时间作为分区的依据，也就是每天我们都会产生相应的分区数据，到时候我们想查某一天的数据，直接去查那个分区的数据即可，不需要去遍历整个数据库去查询，这样的话查询的速度会快很多。

分区先关的技术

1、一个表可以拥有一个或者多个分区，每个分区以文件夹的形式单独存在表文件夹的目录下。

2、表和列名不区分大小写。

3、分区是以字段的形式在表结构中存在，通过describe table命令可以查看到字段存在，但是该字段不存放实际的数据内容，仅仅是分区的表示。

下面我们就创建一个带有分区的数据表

CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (year STRING,month STRING,day STRING);

正文完

请博主喝杯咖啡吧！

发表至： Sql

2017-08-06

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

mathjax 测试