一、使用EXPLAIN
查看逻辑,更多用 EXPLAIN EXTENDED
二、限制调整LIMIT
三、JOIN优化
表足够小用map-side JOIN
四、本地模式
对于小数据集,单机或单线程执行时间比较短
hive> set oldjobtracker=${hiveconf.mapred.job.tracker};
hive> set mapred.job.tracker=local;
hive> set mapred.tmp.dir=/home/edward/tmp
hive> SELECT * from people WHERE firstname=bob;
hive> set mapred.job.tracker=${oldjobtracker};
小于 1 分钟

