TOP N的一些問題,可以實現取得表中最大的一行ID的數據。

SELECT TOP N 問題
作者: unknown 來源: unknown



Hi, everyone:
    本貼討論SELECT TOP N問題.
    現在正在一家計算機公司兼職,開發ASP應用. 在最近的一個商業項目裏有這樣一個需求:用戶在查詢時,只需要按照某(些)列排序後TOP 20的紀錄. SQL SERVER 7很好地支持了TOP N 操作,但考慮到系統移植問題, 我又考慮在其他幾個主流DBMSs中如何實現. 鑑於只有DB2 UDB 7,ORACLE 8i,SQL SERVER 7,本貼僅討論這三個DBMS.
    簡單地說,TOP N問題就是:在SELECT中,僅選擇按照某(些)列排序後TOP N的紀錄. 考慮到等值問題,又可以分爲兩種: 一是僅僅返回N條紀錄(M 1), 二是還包括所有於第N條等值的紀錄(M 2). 當然最內層的子查詢也可以有其他的子句, 或者TOP N也可以應用在沒有ORDER BY的情況下,這樣更簡單.

1. SQL SERVER 7: 用 TOP N (WITH TIES)
M1:
SELECT TOP N * FROM MYTABLE ORDER BY ORD_COL;

M2:
SELECT TOP N  WITH TIES * FROM MYTABLE ORDER BY ORD_COL;
注: SQL SERVER 7提供了PERCENT N WITH TIES, ACCESS 中提供了TOP N,但含義是M 2.

2. ORACLE 8i: 用 ROWNUM<=N
M1:
SELECT * FROM
     ( SELECT * FROM MYTABLE ORDER BY ORD_COL DESC)
WHERE ROWNUM<=N
M2:
SELECT * FROM MYTABLE WHERE ORD_COL>=
   (SELECT MIN(ORD_COL) FROM
        ( SELECT * FROM MYTABLE ORDER BY ORD_COL DESC)
    WHERE ROWNUM<=N)
ORDER BY ORD_COL DESC
注意以下兩種錯誤用法:
WRONG 1:
SELECT * FROM MYTABLE
WHERE  ROWID<=N
ORDER BY ORD_COL DESC;

WRONG 2:(因爲WHERE ROWNUM<=N 在ORDER BY 前執行)
SELECT * FROM MYTABLE
WHERE  ROWNUM<=N
ORDER BY ORD_COL DESC;

3: DB2
用FETCH FIRST N ROWS ONLY
M1:
SELECT * FROM MYTABLE
ORDER BY ORD_COL DESC
FETCH FIRST N ROWS ONLY
M2:
沒有找到,因爲DB2不允許在FROM中嵌套有ORDER BY子句的子查詢.

還不清楚ORACLE的M 2有沒有更好的辦法,以及其他的DBMS如何實現TOP N操作,請其他朋友補充.
----------------------------------------------------------------------------------
各語句已經測試過, EXAMPLE:
create table mytable(mykey int, ord_col int);
insert into mytable values(1, 100);
insert into mytable values(2, 100);
insert into mytable values(3, 99);
insert into mytable values(4, 101);
insert into mytable values(5, 101);
今天繼續討論SELECT TOP N問題.
1. DB2的M 2
在前一篇討論中提到,由於DB2的SUBQUERY不支持ORDER BY子句,因此無法構造M2. 實際上,DB2提供了一組新的函數,稱爲 OLAP FUNCTIONS, 可以很好的支持TOP N問題.
M2:
SELECT * FROM
   (    SELECT MYKEY,RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK
        FROM MYTABLE ) AS RANKED_TABLE
WHERE MYRANK<=N

利用OLAP函數,除了上一篇中所提方法,DB2的M1又可以表示爲:
SELECT * FROM
   (    SELECT MYKEY,ROW_NUMBER() OVER (ORDER BY ORD_COL DESC) AS MYRANK
        FROM MYTABLE ) AS RANKED_TABLE
WHERE MYRANK<=N

2. 除了M1, M2兩種TOP N外,還有一種被DB2稱爲 DENSE_RANK, (M3). 通過下例分別說明.
M1: TOP 3 -- 1(4,101), 2(5,101), 3(1, 100) 或者1(4,101), 2(5,101), 3(2, 100)
M2: TOP 3 -- 1(4,101), 1(5,101), 3(1, 100), 3(2, 100)
M3: TOP 3 -- 1(4,101), 1(5,101), 2(1, 100), 2(2, 100), 3(3,99)
在DB2中, M3如此實現:
SELECT * FROM
   (  SELECT MYKEY,DENSE_RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK
      FROM MYTABLE ) AS RANKED_TABLE
WHERE MYRANK<=N

3. 爲避免DBMSs的方言問題, M2,M3可以有如下標準(SQL 92)表示:
M2:
SELECT * FROM MYTABLE M1 WHERE N>
   (   SELECT COUNT(*) FROM MYTABLE M2
       WHERE M2.ORD_COL>M1.ORD_COL);
注意: 兩個比較符都是 >
M3:
SELECT * FROM MYTABLE M1 WHERE N>
   (   SELECT COUNT(DISTINCT M2.ORD_COL) FROM MYTABLE M2
       WHERE M2.ORD_COL>M1.ORD_COL);
注意: 與M2的不同在於DISTINCT的使用
至於M1, 我目前還沒有想到合適的標準寫法,請補充.

4. 關於MYSQL
相對於各主流RDBMS來說,MYSQL要簡單,幼稚地多. 在運行MYSQL時發現居然不支持SUBQUERY. 因此MYSQL中的TOP N問題要複雜一些.
SELECT * FROM MYTABLE, MYTABLE M2
WHERE M2.ORD_COL>=M1.ORD_COL
GROUP BY M1.MYKEY
HAVING COUNT(M2.ORD_COL) <=N
但是,這個語句是有問題的. 一個極端的例子: 當所有的ORD_COL的數值都一樣時. 如果哪位想到了如何解決這個問題,請補充.

----------------------------------------------------------------------------------
各語句已經測試過, EXAMPLE:
create table mytable(mykey int, ord_col int);
insert into mytable values(1, 100);
insert into mytable values(2, 100);
insert into mytable values(3, 99);
insert into mytable values(4, 101);
insert into mytable values(5, 101)

發佈了28 篇原創文章 · 獲贊 3 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章