說到視窗框架就不得不提起開窗函數。 開窗函數支持分區、排序和框架三種元素,其語法格式如下: 視窗分區: 就是將視窗指定列具有相同值的那些行進行分區,分區與分組比較類似,但是分組指定後對於整個SELECT語句只能按照這個分組,不過 分區可以在一條語句中指定不同的分區。 1 <PARTITION BY ...
說到視窗框架就不得不提起開窗函數。
開窗函數支持分區、排序和框架三種元素,其語法格式如下:
1 OVER ( 2 [ <PARTITION BY clause> ] 3 [ <ORDER BY clause> ] 4 [ <ROW or RANGE clause> ] 5 )
視窗分區:
就是將視窗指定列具有相同值的那些行進行分區,分區與分組比較類似,但是分組指定後對於整個SELECT語句只能按照這個分組,不過 分區可以在一條語句中指定不同的分區。1 <PARTITION BY clause> ::= 2 PARTITION BY value_expression , ... [ n ]
視窗排序:
分區之後可以指定排序列,那麼在視窗計算之前,各個視窗的行的邏輯順序將確定。
1 <ORDER BY clause> ::= 2 ORDER BY order_by_expression 3 [ COLLATE collation_name ] 4 [ ASC | DESC ] 5 [ ,...n ]
視窗框架:
框架是對視窗進行進一步的分區,框架有兩種範圍限定方式:一種是使用ROWS子句,通過指定當前行之前或之後的固定數目的行來限制分區中的行數; 另一種是RANGE子句,按照排序列的當前值,根據相同值來確定分區中的行數。1 <ROW or RANGE clause> ::= 2 { ROWS | RANGE } <window frame extent> 3 4 <window frame extent> ::= 5 { <window frame preceding> 6 | <window frame between> 7 } 8 <window frame between> ::= 9 BETWEEN <window frame bound> AND <window frame bound> 10 11 <window frame bound> ::= 12 { <window frame preceding> 13 | <window frame following> 14 } 15 16 <window frame preceding> ::= 17 { 18 UNBOUNDED PRECEDING 19 | <unsigned_value_specification> PRECEDING 20 | CURRENT ROW 21 } 22 23 <window frame following> ::= 24 { 25 UNBOUNDED FOLLOWING 26 | <unsigned_value_specification> FOLLOWING 27 | CURRENT ROW 28 } 29 30 <unsigned value specification> ::= 31 { <unsigned integer literal> }
當使用框架時,必須要有ORDER BY子句,如果僅指定了ORDER BY子句而未指定框架,那麼預設框架將採用 RANGE UNBOUNDED PRECEDING AND CURRENT ROW。
如果視窗函數沒有指定ORDER BY子句,也就不存在ROWS/RANGE視窗的計算。
如果ROWS/RANGE子句採用 <window frame preceding>,那麼CURRENT ROW 作為框架的預設結束行,例如:“ROWS 5 PRECEDING” 等價於 “ROWS BETWEEN 5 PRECEDING AND CURRENT ROW”。
PS:RANGE 只支持使用 UNBOUNDED 和 CURRENT ROW 視窗框架分隔符。
未使用 partition by 指定分區示例:
1 select *, 2 sum(U_Id) over(order by U_Id) 列1, 3 sum(U_Id) over(order by U_Id RANGE BETWEEN unbounded preceding AND CURRENT ROW) 列2, 4 sum(U_Id) over(order by U_Id rows BETWEEN unbounded preceding AND CURRENT ROW) 列3, 5 sum(U_Id) over(order by U_Id rows BETWEEN 1 preceding AND 2 following) 列4, 6 sum(U_Id) over(order by U_Id ROWS BETWEEN 1 PRECEDING AND CURRENT ROW) 列5 7 from UserInfo
結果分析:
RANGE 是邏輯視窗,是指定當前行對應值的範圍取值,列數不固定,只要行值在範圍內,對應列都包含在內。
ROWS 是物理視窗,即根據order by 子句排序後,取的前N行及後N行的數據計算。(與當前行的值無關,只與排序後的行號相關)
【列1】未指定視窗,所以預設為 RANGE UNBOUNDED PRECEDING AND CURRENT ROW,故此與【列2】值相同。
【列2】RANGE BETWEEN unbounded preceding AND CURRENT ROW 表示指定取值範圍為 當前行與當前行前面的所有行的值。
即第一行的值為:1 第二行的值為:3+1 第三行的值為:4+3+1
【列3】rows BETWEEN unbounded preceding AND CURRENT ROW 表示指定取值範圍為 當前行與當前行前面的所有行的值。
即第一行的值為:1 第二行的值為:3+1 第三行的值為:4+3+1
【列4】rows BETWEEN 1 preceding AND 2 following 表示指定取值範圍為 當前行與前一行和後兩行的值。
即第一行的值為:1+3+4 第二行的值為:1+3+4+5 第三行的值為:3+4+5+6
【列5】ROWS BETWEEN 1 PRECEDING AND CURRENT ROW 表示指定取值範圍為 當前行與前一行的值。
即第一行的值為:1 第二行的值為:1+3 第三行的值為:3+4
使用 partition by 指定分區示例:
1 select *, 2 sum(U_Id) over(partition by U_Pwd order by U_Id) 列1, 3 sum(U_Id) over(partition by U_Pwd order by U_Id RANGE BETWEEN unbounded preceding AND CURRENT ROW) 列2, 4 sum(U_Id) over(partition by U_Pwd order by U_Id rows BETWEEN unbounded preceding AND CURRENT ROW) 列3, 5 sum(U_Id) over(partition by U_Pwd order by U_Id rows BETWEEN 1 preceding AND 2 following) 列4, 6 sum(U_Id) over(partition by U_Pwd order by U_Id ROWS BETWEEN 1 PRECEDING AND CURRENT ROW) 列5 7 from UserInfo
以上根據 列(U_Pwd)被分為3個區,使用 partition by 指定分區就是先進行分區,然後再根據指定視窗和指定視窗取值範圍進行計算。
參考:
https://docs.microsoft.com/en-us/sql/t-sql/queries/select-over-clause-transact-sql