為了方便大家學(xué)習(xí)和測(cè)試,所有的例子都是在Oracle自帶用戶Scott下建立的。
注:標(biāo)題中的紅色order by是說(shuō)明在使用該方法的時(shí)候必須要帶上order by。
一、rank()/dense_rank() over(partition by ...order by ...)
現(xiàn)在客戶有這樣一個(gè)需求,查詢每個(gè)部門工資最高的雇員的信息,相信有一定oracle應(yīng)用知識(shí)的同學(xué)都能寫出下面的SQL語(yǔ)句:
select e.ename, e.job, e.sal, e.deptno
from scott.emp e,
(select e.deptno, max(e.sal) sal from scott.emp e group by e.deptno) me
where e.deptno = me.deptno
and e.sal = me.sal;
在滿足客戶需求的同時(shí),大家應(yīng)該習(xí)慣性的思考一下是否還有別的方法。這個(gè)是肯定的,就是使用本小節(jié)標(biāo)題中rank() over(partition by...)或dense_rank() over(partition by...)語(yǔ)法,SQL分別如下:
select e.ename, e.job, e.sal, e.deptno
from (select e.ename,
e.job,
e.sal,
e.deptno,
rank() over(partition by e.deptno order by e.sal desc) rank
from scott.emp e) e
where e.rank = 1;
select e.ename, e.job, e.sal, e.deptno
from (select e.ename,
e.job,
e.sal,
e.deptno,
dense_rank() over(partition by e.deptno order by e.sal desc) rank
from scott.emp e) e
where e.rank = 1;
為什么會(huì)得出跟上面的語(yǔ)句一樣的結(jié)果呢?這里補(bǔ)充講解一下rank()/dense_rank() over(partition by e.deptno order by e.sal desc)語(yǔ)法。
over: 在什么條件之上。
partition by e.deptno: 按部門編號(hào)劃分(分區(qū))。
order by e.sal desc: 按工資從高到低排序(使用rank()/dense_rank() 時(shí),必須要帶order by否則非法)
rank()/dense_rank(): 分級(jí)
整個(gè)語(yǔ)句的意思就是:在按部門劃分的基礎(chǔ)上,按工資從高到低對(duì)雇員進(jìn)行分級(jí),“級(jí)別”由從小到大的數(shù)字表示(最小值一定為1)。
那么rank()和dense_rank()有什么區(qū)別呢?
rank(): 跳躍排序,如果有兩個(gè)第一級(jí)時(shí),接下來(lái)就是第三級(jí)。
dense_rank(): 連續(xù)排序,如果有兩個(gè)第一級(jí)時(shí),接下來(lái)仍然是第二級(jí)。
小作業(yè):查詢部門最低工資的雇員信息。
二、min()/max() over(partition by ...)
現(xiàn)在我們已經(jīng)查詢得到了部門最高/最低工資,客戶需求又來(lái)了,查詢雇員信息的同時(shí)算出雇員工資與部門最高/最低工資的差額。這個(gè)還是比較簡(jiǎn)單,在第一節(jié)的groupby語(yǔ)句的基礎(chǔ)上進(jìn)行修改如下:
select e.ename,
e.job,
e.sal,
e.deptno,
e.sal - me.min_sal diff_min_sal,
me.max_sal - e.sal diff_max_sal
from scott.emp e,
(select e.deptno, min(e.sal) min_sal, max(e.sal) max_sal
from scott.emp e
group by e.deptno) me
where e.deptno = me.deptno
order by e.deptno, e.sal;
上面我們用到了min()和max(),前者求最小值,后者求最大值。如果這兩個(gè)方法配合over(partition by ...)使用會(huì)是什么效果呢?大家看看下面的SQL語(yǔ)句:
select e.ename,
e.job,
e.sal,
e.deptno,
nvl(e.sal - min(e.sal) over(partition by e.deptno), 0) diff_min_sal,
nvl(max(e.sal) over(partition by e.deptno) - e.sal, 0) diff_max_sal
from scott.emp e;
這兩個(gè)語(yǔ)句的查詢結(jié)果是一樣的,大家可以看到min()和max()實(shí)際上求的還是最小值和最大值,只不過(guò)是在partition by分區(qū)基礎(chǔ)上的。
小作業(yè):如果在本例中加上order by,會(huì)得到什么結(jié)果呢?
三、lead()/lag() over(partition by ... order by ...)
中國(guó)人愛(ài)攀比,好面子,聞名世界。客戶更是好這一口,在和最高/最低工資比較完之后還覺(jué)得不過(guò)癮,這次就提出了一個(gè)比較變態(tài)的需求,計(jì)算個(gè)人工資與比自己高一位/低一位工資的差額。這個(gè)需求確實(shí)讓我很是為難,在groupby語(yǔ)句中不知道應(yīng)該怎么去實(shí)現(xiàn)。不過(guò)。。。。現(xiàn)在我們有了over(partition by ...),一切看起來(lái)是那么的簡(jiǎn)單。如下:
select e.ename,
e.job,
e.sal,
e.deptno,
lead(e.sal, 1, 0) over(partition by e.deptno order by e.sal) lead_sal,
lag(e.sal, 1, 0) over(partition by e.deptno order by e.sal) lag_sal,
nvl(lead(e.sal) over(partition by e.deptno order by e.sal) - e.sal,
0) diff_lead_sal,
nvl(e.sal - lag(e.sal) over(partition by e.deptno order by e.sal), 0) diff_lag_sal
from scott.emp e;
看了上面的語(yǔ)句后,大家是否也會(huì)覺(jué)得虛驚一場(chǎng)呢(驚出一身冷汗后突然雞凍起來(lái),這樣容易感冒)?我們還是來(lái)講解一下上面用到的兩個(gè)新方法吧。
lead(列名,n,m): 當(dāng)前記錄后面第n行記錄的列名>的值,沒(méi)有則默認(rèn)值為m;如果不帶參數(shù)n,m,則查找當(dāng)前記錄后面第一行的記錄列名>的值,沒(méi)有則默認(rèn)值為null。
lag(列名,n,m): 當(dāng)前記錄前面第n行記錄的列名>的值,沒(méi)有則默認(rèn)值為m;如果不帶參數(shù)n,m,則查找當(dāng)前記錄前面第一行的記錄列名>的值,沒(méi)有則默認(rèn)值為null。
下面再列舉一些常用的方法在該語(yǔ)法中的應(yīng)用(注:帶order by子句的方法說(shuō)明在使用該方法的時(shí)候必須要帶order by):
select e.ename,
e.job,
e.sal,
e.deptno,
first_value(e.sal) over(partition by e.deptno) first_sal,
last_value(e.sal) over(partition by e.deptno) last_sal,
sum(e.sal) over(partition by e.deptno) sum_sal,
avg(e.sal) over(partition by e.deptno) avg_sal,
count(e.sal) over(partition by e.deptno) count_num,
row_number() over(partition by e.deptno order by e.sal) row_num
from scott.emp e;
大家在讀完本片文章之后可能會(huì)有點(diǎn)誤解,就是OVER (PARTITION BY ..)比GROUP BY更好,實(shí)際并非如此,前者不可能替代后者,而且在執(zhí)行效率上前者也沒(méi)有后者高,只是前者提供了更多的功能而已,所以希望大家在使用中要根據(jù)需求情況進(jìn)行選擇。