SELECTSynopsisSELECT [ ALL | DISTINCT [ ON ( expression [, ...] ) ] ] * | expression [ AS output_name ] [, ...] [ FROM from_item [, ...] ] [ WHERE condition ] [ GROUP BY expression [, ...] ] [ HAVING condition [, ...] ] [ { UNION | INTERSECT | EXCEPT } [ ALL ] select ] [ ORDER BY expression [ ASC | DESC | USING operator ] [, ...] ] [ LIMIT { count | ALL } ] [ OFFSET start ] [ FOR { UPDATE | SHARE } [ OF table_name [, ...] ] ] 这里 from_item 可以是: [ ONLY ] table_name [ * ] [ [ AS ] alias [ ( column_alias [, ...] ) ] ] ( select ) [ AS ] alias [ ( column_alias [, ...] ) ] function_name ( [ argument [, ...] ] ) [ AS ] alias [ ( column_alias [, ...] | column_definition [, ...] ) ] function_name ( [ argument [, ...] ] ) AS ( column_definition [, ...] ) from_item [ NATURAL ] join_type from_item [ ON join_condition | USING ( join_column [, ...] ) ] 描述SELECT 将从零个或更多表中返回记录行。 SELECT 通常的处理如下:
你必须有 SELECT 权限用来从表中读取数值。 使用 FOR UPDATE FOR SHARE 还要求 UPDATE 权限。 参数FROM 子句FROM 子句为 SELECT 声明一个或者多个源表。 如果声明了多个源表,那么结果就是所有源表的笛卡儿积(交叉连接)。 但是通常我们会添加一些条件,把返回行限制成笛卡儿积的一个小的结果集。 FROM 子句可以包括下列元素:
WHERE 子句可选的 WHERE 条件有如下常见的形式: WHERE condition 这里 condition 可以是任意生成类型为 boolean 的表达式。 任何不满足这个条件的行都会从输出中删除。如果一个行的数值替换到条件的引用中计算出来的条件为真,那么该行就算满足条件。 GROUP BY 子句可选的 GROUP BY 子句的一般形式 GROUP BY expression [, ...] GROUP BY 将把所有在组合了的表达式上共享同样的值的行压缩成一行。 expression 可以是一个输入字段名字, 或者是一个输入字段(SELECT 列表)的序号,或者也可以是任意从输入字段值形成的任意表达式。 在有歧义的情况下,一个 GROUP BY 的名字将被解释成输入字段的名字,而不是输出字段的名字。 如果使用了聚集函数,那么就会对组成一组的所有行进行计算,为每个组生成一个独立的值(而如果没有 GROUP BY, 那么聚集对选出来的所有行计算出一个值)。如果出现了 GROUP BY, 那么 SELECT 列表表达式中再引用那些没有分组的字段就是非法的, 除非放在聚集函数里,因为对于未分组的字段,可能会返回多个数值。 HAVING 子句可选的 HAVING 子句有如下形式: HAVING condition 这里 condition 和为 WHERE 子句里声明的相同。 HAVING 去除了一些不满足条件的组行。 HAVING 与 WHERE 不同: WHERE 在使用 GROUP BY 之前过滤出单独的行,而 HAVING 过滤由 GROUP BY 创建的行。 在 condition 里引用的每个字段都必须无歧义地引用一个分组的行,除非引用出现在一个聚集函数里。 HAVING 的出现把查询变成一个分组的查询,即使没有 GROUP BY 子句也这样。这一点和那些包含聚集函数,但是没有 GROUP BY 子句的查询里发生的事情是一样的。 所有选取的行都被认为会形成一个单一的组,而 SELECT 列表和 HAVING 子句只能从聚集函数里面引用表的字段。这样的查询在 HAVING 条件为真的时候将发出一个行, 如果为非真,则返回零行。 SELECT 列表SELECT 列表(在 SELECT 和 FROM 之间的关键字) 声明形成 SELECT 语句的输出行的表达式。 这些表达式可以(并且通常也会)引用在 FROM 子句里面计算出来的字段。 通过使用子句 AS output_name, 我们可以为输出字段生命那另外有个名字。 这个名字在给字段输出显示方面特别有用。 它页可以用于在 ORDER BY 和 GROUP BY 子句中引用字段值, 但是不能在 WHERE 或者 HAVING 子句中使用; 在那里你必须写表达式本身。 除了表达式,我们也可以在输出列表中写一个 *, 表示查出所有字段的缩写。还有,我们可以用 table_name.* 作为来自该表的所有字段的缩写。 UNION 子句UNION 子句的一般形式是: select_statement UNION [ ALL ] select_statement 这里 select_statement 是任意没有 ORDER BY,LIMIT, FOR UPDATE 或者 FOR SHARE 子句的 SELECT语句。 (如果用圆括弧包围,ORDER BY 和 LIMIT 可以附着在子表达式里。 如果没有圆括弧,这些子句将交给 UNION 的结果使用, 而不是给它们右手边的输入表达式。) UNION 操作符计算那些涉及到的所有 SELECT 语句返回的行的结果联合。 一个行如果至少在两个结果集中的一个里面出现,那么它就会在这两个结果集的集合联合中。 两个做为 UNION 直接操作数的SELECT必须生成相同数目的字段, 并且对应的字段必须有兼容的数据类型。 缺省地,UNION 的结果不包含任何重复的行,除非声明了 ALL 子句。 ALL 制止了消除重复的动作。 (因此,UNION ALL 通常比 UNION 明显要快,可能的情况下尽量使用 ALL。) 同一SELECT语句中的多个 UNION 操作符是从左向右计算的, 除非用圆括弧进行了标识。 目前,FOR UPDATE 和 FOR SHARE 不能在 UNION 的结果或输入中声明。 INTERSECT 子句INTERSECT 子句的一般形式是: select_statement INTERSECT [ ALL ] select_statement select_statement 是任何不带 ORDER BY, LIMIT,FOR UPDATE 或者 FOR SHARE 子句的 SELECT 语句。 INTERSECT 计算涉及的 SELECT 语句返回的行的集合交集。 如果一个行在两个结果集中都出现,那么它就在两个结果集的交集中。 INTERSECT 的结果不包含任何重复行,除非你声明了 ALL 选项。 用了 ALL 以后,一个在左手边的表里有 m 个重复而在右手边表里有 n 个重复的行将出现 min(m,n) 次。 除非用圆括号指明顺序, 同一 SELECT 语句中的多个 INTERSECT 操作符是从左向右计算的。 INTERSECT 比 UNION 绑定得更紧 — 也就是说 A UNION B INTERSECT C 将读做 A UNION (B INTERSECT C),除非你用圆括弧声明。 目前,不能给 INTERSECT 的结果或者任何 INTERSECT 的输入声明 FOR UPDATE 或者 FOR SHARE。 EXCEPT 子句EXCEPT 子句有如下的通用形式: select_statement EXCEPT [ ALL ] select_statement 这里 >select_statement 是任何没有 ORDER BY,LIMIT,FOR UPDATE 或者 FOR SHARE 子句的 SELECT 表达式。 EXCEPT操作符计算存在于左边SELECT 语句的输出而不存在于右边语句输出的行。 EXCEPT 的结果不包含任何重复的行,除非声明了 ALL 选项。 使用 ALL 时,一个在左手边表中有 m 个重复而在右手边表中有 n 个重复的行将出现 max(m-n,0) 次。 除非用圆括弧指明顺序,同一 SELECT 语句中的多个 EXCEPT 操作符是从左向右计算的。 EXCEPT 和 UNION 绑定级别相同。 目前,不能给 EXCEPT 的结果或者任何 EXCEPT 的输入声明 FOR UPDATE 或者 FOR SHARE 子句。 ORDER BY 子句可选地 ORDER BY 子句有下面的一般形式: ORDER BY expression [ ASC | DESC | USING operator ] [, ...] expression 可以是一个输出字段(SELECT 列表)的名字或者序号, 或者也可以是用输入字段的数值组成的任意表达式。 ORDER BY 子句导致结果行根据指定的表达式进行排序。 如果根据最左边的表达式,两行的结果相同,那么就根据下一个表达式进行比较, 依此类推。如果对于所有声明的表达式他们都相同,那么以随机顺序返回。 序数指的是列/字段按顺序(从左到右)的位置。 这个特性让我们可以对没有唯一名称的列/字段进行排序。 这一点从来不是必须的, 因为总是可以通过 AS 子句给一个要计算的列/字段赋予一个名称。 在 ORDER BY 里还可以使用任意表达式, 包括那些没有出现在SELECT结果列表里面的字段。 因此下面的语句现在是合法的: SELECT name FROM distributors ORDER BY code; 这个特性的一个局限就是应用于 UNION,INTERSECT, 或者 EXCEPT 查询的 ORDER BY 子句只能在一个输出字段名或者数字上声明,而不能在一个表达式上声明。 请注意如果一个 ORDER BY 表达式是一个简单名称, 同时匹配结果字段和输入字段, ORDER BY 将把它解释成结果字段名称。 这和 GROUP BY 在同样情况下做的选择正相反。 这样的不一致是由 SQL 标准强制的。 我们可以给 ORDER BY 子句里每个列/字段加一个关键字 DESC (降序)或 ASC(升序)。如果不声明, ASC 是缺省。 我们还可以在 USING 子句里声明一个排序操作符来实现排序。 ASC 等效于使用 USING < 而 DESC 等效于使用 USING >。 在一个域里,空值排序时排在其它数值前面。换句话说,升序排序时, 空值排在末尾,而降序排序时空值排在开头。 字符类型的数据是按照区域相关的字符集顺序排序的,这个区域是在数据库集群初始化的时候建立的。 DISTINCT 子句如果声明了 DISTINCT,那么就从结果集中删除所有重复的行(每个有重复的组都保留一行)。 ALL 声明相反的作用:所有行都被保留;这个是缺省。 DISTINCT ON ( expression [, ...] ) 只保留那些在给出的表达式上运算出相同结果的行集合中的第一行。 DISTINCT ON 表达式是使用与 ORDER BY (见上文) 相同的规则进行解释的。请注意, 除非我们使用了 ORDER BY 来保证我们需要的行首先出现,否则,每个 "第一行" 是不可预测的。 比如, SELECT DISTINCT ON (location) location, time, report FROM weather_reports ORDER BY location, time DESC; 为每个地点检索最近的天气报告。但是如果我们没有使用 ORDER BY 来强制对每个地点的时间值进行降序排序,那么我们就会得到每个地点的不知道什么时候的报告。 DISTINCT ON 表达式必须匹配最左边的 ORDER BY 表达式。 ORDER BY 子句将通常包含额外的表达式来判断每个 DISTINCT ON 组里面需要的行的优先级。 LIMIT 子句LIMIT 子句由两个独立的子句组成: LIMIT { count | ALL } OFFSET start 这里 count 声明返回的最大行数, 而 start 声明开始返回行之前忽略的行数。 LIMIT 允许你检索由查询其他部分生成的行的某一部分。 如果给出了限制计数,那么返回的行数不会超过哪个限制。 如果给出了一个偏移量,那么开始返回行之前会忽略那个数量的行。 在使用 LIMIT 时, 一个好习惯是使用一个 ORDER BY 子句把结果行限制成一个唯一的顺序。 否则你会得到无法预料的查询返回的子集 — 你可能想要第十行到第二十行, 但以什么顺序?除非你声明 ORDER BY,否则你不知道什么顺序。 查询优化器在生成查询规划时把 LIMIT 考虑进去了, 所以你很有可能因给出的 LIMIT 和 OFFSET 值不同而得到不同的规划(生成不同的行序)。 因此用不同的 LIMIT/OFFSET 值选择不同的查询结果的子集将不会产生一致的结果, 除非你用 ORDER BY 强制生成一个可预计的结果顺序。 这可不是毛病;这是 SQL 生来的特点,因为除非用了 ORDER BY 约束顺序, SQL 不保证查询生成的结果有任何特定的顺序。 FOR UPDATE/FOR SHARE 子句FOR UPDATE 子句有下面的形式 FOR UPDATE [ OF table_name [, ...] ] 很相近的 FOR SHARE 子句的形式如下: FOR SHARE [ OF table_name [, ...] ] FOR UPDATE 令那些被 SELECT 语句检索出来的行被锁住,就像要更新一样。 这样就避免它们在当前事务结束前被其它事务修改或者删除; 也就是说,其它视图 UPDATE,DELETE, 或者 SELECT FOR UPDATE 这些行的事务将被阻塞, 直到当前事务结束。同样,如果一个来自其它事务的 UPDATE, DELETE,或者 SELECT FOR UPDATE 已经锁住了某个或某些选定的行,SELECT FOR UPDATE 将等到那些事务结束, 并且将随后锁住并返回更新的行(或者不返回行,如果行已经被删除)。 更多的讨论参阅 Chapter 12。 FOR SHARE 的行为类似,只是它在每个检索出来的行上要求一个共享锁,而不是一个排它锁。 一个共享锁阻塞其它事务在这些行上执行 UPDATE, DELETE,或者 SELECT FOR UPDATE, 但是不阻止他们执行 SELECT FOR SHARE。 目前还不允许一个 SELECT 同时包含 FOR UPDATE 和 FOR SHARE。 如果特定的表在 FOR UPDATE 或者 FOR SHARE 中给出, 那么只有来自这些表中的行才被锁住; 任何在 SELECT 中使用的其它表都只是和平常一样读取。 FOR UPDATE 和 FOR SHARE 不能在那些无法使用独立的表数据行清晰标识返回行的环境里; 比如,它不能和聚集一起使用。 一个 SELECT 命令可以同时使用 LIMIT 和 LIMIT, 这种情况下,它返回的行数可能比 LIMIT 声明的少。 这是因为 LIMIT 先生效。命令选取指定数目的数据行, 但是可能会在其中一行或者多行上获取锁的时候阻塞住。 一旦 SELECT 的阻塞被解除了,该行可能已经被删除或者更新了, 因此不再满足查询的 WHERE 条件,在这种情况下,不会返回它。 例子将表 films 和表 distributors 连接在一起: SELECT f.title, f.did, d.name, f.date_prod, f.kind FROM distributors d, films f WHERE f.did = d.did title | did | name | date_prod | kind -------------------+-----+--------------+------------+---------- The Third Man | 101 | British Lion | 1949-12-23 | Drama The African Queen | 101 | British Lion | 1951-08-11 | Romantic ... 统计用kind 分组的所有电影和组的列/字段的 len(长度)的和: SELECT kind, sum(len) AS total FROM films GROUP BY kind; kind | total ----------+------- Action | 07:34 Comedy | 02:58 Drama | 14:28 Musical | 06:42 Romantic | 04:38 统计所有电影(films),组的列/字段 len(长度)的和,用 kind 分组并且显示小于5小时的组总和: SELECT kind, sum(len) AS total FROM films GROUP BY kind HAVING sum(len) < interval ‘5 hour‘; kind | total ----------+------- Comedy | 02:58 Romantic | 04:38 下面两个例子是根据第二列(name)的内容对单独的结果排序的经典的方法: SELECT * FROM distributors ORDER BY name; SELECT * FROM distributors ORDER BY 2; did | name -----+------------------ 109 | 20th Century Fox 110 | Bavaria Atelier 101 | British Lion 107 | Columbia 102 | Jean Luc Godard 113 | Luso films 104 | Mosfilm 103 | Paramount 106 | Toho 105 | United Artists 111 | Walt Disney 112 | Warner Bros. 108 | Westward 下面这个例子演示如何获得表 distributors 和 actors的连接, 只将每个表中以字母 W 开头的取出来。 因为只取了不相关的行,所以关键字 ALL 被省略了: distributors: actors: did | name id | name -----+-------------- ----+---------------- 108 | Westward 1 | Woody Allen 111 | Walt Disney 2 | Warren Beatty 112 | Warner Bros. 3 | Walter Matthau ... ... SELECT distributors.name FROM distributors WHERE distributors.name LIKE ‘W%‘ UNION SELECT actors.name FROM actors WHERE actors.name LIKE ‘W%‘ name ---------------- Walt Disney Walter Matthau Warner Bros. Warren Beatty Westward Woody Allen 这个例子显示了如何在 FROM 子句中使用一个函数, 包括带有和不带字段定义列表的。 CREATE FUNCTION distributors(int) RETURNS SETOF distributors AS $$ SELECT * FROM distributors WHERE did = $1; $$ LANGUAGE SQL; SELECT * FROM distributors(111); did | name -----+------------- 111 | Walt Disney CREATE FUNCTION distributors_2(int) RETURNS SETOF record AS $$ SELECT * FROM distributors WHERE did = $1; $$ LANGUAGE SQL; SELECT * FROM distributors_2(111) AS (f1 int, f2 text); f1 | f2 -----+------------- 111 | Walt Disney 兼容性当然,SELECT 语句和 SQL 标准兼容。但是还有一些扩展和一些缺少的特性。 省略 FROM 子句PostgreSQL 允许我们在一个查询里省略 FROM 子句。 它的最直接用途就是计算简单的常量表达式的结果: SELECT 2+2; ?column? ---------- 4 其它有些 SQL 数据库不能这么做,除非引入一个单行的伪表做 SELECT 的数据源。 请注意,如果没有声明 FROM 子句,那么查询不能引用任何数据库表。 比如,下面的查询是非法的: SELECT distributors.* WHERE distributors.name = ‘Westward‘; PostgreSQL 8.1 之前的版本支持这种形式的查询, 为查询里引用的每个表都增加一个隐含的条目。现在这个不再是缺省的行为了, 因为它和 SQL 标准不兼容,并且被认为太容易导致错误了。 为了兼容那些依赖这个行为的应用,我们可以打开 add_missing_from 配置参数。 AS 关键字在 SQL 标准里,可选的关键字 AS 是多余的,可以忽略掉而不对语句产生任何影响。 PostgreSQL 分析器在重命名列/字段时需要这个关键字, 因为类型扩展的特性会导致在这个环境里的歧义。 不过,AS 在 FROM 项里是可选的。 GROUP BY 和 ORDER BY 里可用的名字空间在 SQL-92 标准里,ORDER BY 子句只能使用结果字段名或者编号, 而 GROUP BY 子句只能用基于输入字段名的表达式。 PostgreSQL 对这两个子句都进行了扩展, 允许另外一种选择(但是如果存在歧义,则使用标准的解释)。 PostgreSQL 还允许两个子句声明任意的表达式。 请注意在表达式中出现的名字强总是被当作输入字段名,而不是结果字段名。 SQL:1999 一个略微不同的定义,和 SQL-92 并不能完全向上兼容。 不过,在大多数情况下,PostgreSQL 将把一个 ORDER BY 或者 GROUP BY 表达式解析成为 SQL:1999 制定的那样。 |
|