Apache Flink 漫谈系列(10) - JOIN LATERAL
副标题[/!--empirenews.page--]
一、聊什么 上一篇《Apache Flink 漫谈系列 - JOIN算子》我们对最常见的JOIN做了详尽的分析,本篇介绍一个特殊的JOIN,那就是JOIN LATERAL。JOIN LATERAL为什么特殊呢,直观说因为JOIN的右边不是一个实际的物理表,而是一个VIEW或者Table-valued Funciton。本篇会先介绍传统数据库对LATERAL JOIN的支持,然后介绍Apache Flink目前对LATERAL JOIN的支持情况。 二、实际问题 假设我们有两张表,一张是Customers表(消费者id, 所在城市), 一张是Orders表(订单id,消费者id),两张表的DDL(SQL Server)如下:
查看数据:
查看数据: 1. 问题示例 假设我们想查询所有Customers的客户ID,地点和订单信息,我们想得到的信息是: (1) 用INNER JOIN解决 如果大家查阅了《Apache Flink 漫谈系列 - JOIN算子》,我想看到这样的查询需求会想到INNER JOIN来解决,SQL如下:
查询结果如下: 但如果我们真的用上面的方式来解决,就不会有本篇要介绍的内容了,所以我们换一种写法。 2. 用 Correlated subquery解决 Correlated subquery 是在subquery中使用关联表的字段,subquery可以在FROM Clause中也可以在WHERE Clause中。
用WHERE Clause实现上面的查询需求,SQL如下:
执行情况: 上面的问题是用在WHERE Clause里面subquery的查询列必须和需要比较的列对应,否则我们无法对o.orderid进行投影, 上面查询我为什么要加一个o.orderid呢,因为查询需求是需要o.orderid的,去掉o.orderid查询能成功,但是拿到的结果并不是我们想要的,如下:
查询结果: 可见上面查询结果缺少了o.orderid,不能满足我们的查询需求。
(编辑:青岛站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |