一、分区
Hive 中分区的功能是非常有用的。因为通常要对输入进行全盘扫描,来满足查询条件。
如:存储日志,log_2020_01_01、log_2020_01_02等
hive> CREATE TABLE
hive> CREATE TABLE log_2020_01_01 (id int, part string, quantity int);
hive> CREATE TABLE log_2020_01_02 (id int, part string, quantity int);
hive> CREATE TABLE log_2020_01_04 (id int, part string, quantity int);
hive> SELECT part,quantity log_2020_01_01
> UNION ALL
> SELECT part,quantity from log_2020_01_04
> WHERE quantity < 4;
大约 3 分钟