HIVE：用外连接替代子查询 - 军军小站|张军博客

由于hive也支持sql，很多人会把hql跟标准sql进行比较，甚至有的时候会直接套用。hive不支持事务也不支持索引，更不支持追加写，但是对于一般的sql都是能够支持的。但是对于一些子查询确实无法支持的，例如

      select * from t_ext_1_bkdoubledelete where f1=(select max(f1) from t_ext_1_bkdoubledelete)

　　这个sql在mysql中是能够支持的，意思是找到val最大的那一行记录，然后在hive中运行确实报错的；替代的是用左外连接：

      select * from (select max(f1) as maxf1 from t_ext_1_bkdoubledelete) t1  left outer join (select * from t_ext_1_bkdoubledelete) t2 on t1.maxf1=t2.f1

　　在上面的外连接中，先生成一个临时表t1获取其中最大的值max(f1)，然后以max(f1)为左值，通过对自己的连接获取到相关的行；从而获取到最大行；

下面的这个例子更有意义，使用外连接获取到用户的浏览记录。用户访问apapche后留下一条访问记录，对 apache log的一个数据分析，现在hive里有一个表，一个字段是url，就是请求的网页的url，然后一个字段是time，按时间排序，想要得到所有的在访问百度之后访问的url，就比如说我访问了www.baidu.com，然后我访问了淘宝，那么www.taobao.com就是结果中的一条数据。

      select t1.time1,t1.fromurl,t2.tourl from 
      

      (select time time1,url fromurl,userid from urlLog) t1 
      

      left  outer join 
      

      urlLog t2 
      

      on t1.userid=t2.userid 
      

      where t1.time1<t2.time and fromurl="www.baidu.com"

更加蛋疼的例子，可以看这个：

http://bbs.csdn.net/topics/390414342

HIVE：用外连接替代子查询

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索：z360901061

微信扫一扫加我为好友

QQ号联系： 360901061

您的支持是博主写作最大的动力，如果您喜欢我的文章，感觉我的文章对您有帮助，请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧，狠狠点击下面给点支持吧，站长非常感激您！手机微信长按不能支付解决办法：请将微信支付二维码保存到相册，切换到微信，然后点击微信右上角扫一扫功能，选择支付二维码完成支付。

【本文对您有帮助就好】元

2元

5元

10元

20元

自定义