SQL語句性能調整原則_ZenDei技術網路在線

一、問題的提出在應用系統開發初期，由於開發資料庫數據比較少，對於查詢SQL語句，複雜視圖的的編寫等體會不出SQL語句各種寫法的性能優劣，但是如果將應用系統提交實際應用後，隨著資料庫中數據的增加，系統的響應速度就成為目前系統需要解決的最主要的問題之一。系統優化中一個很重要的方面就是SQL語句的優化。 ...

一、問題的提出

在應用系統開發初期，由於開發資料庫數據比較少，對於查詢SQL語句，複雜視圖的的編寫等體會不出SQL語句各種寫法的性能優劣，但是如果將應用系統提交實際應用後，隨著資料庫中數據的增加，系統的響應速度就成為目前系統需要解決的最主要的問題之一。系統優化中一個很重要的方面就是SQL語句的優化。對於海量數據，劣質SQL語句和優質SQL語句之間的速度差別可以達到上百倍，可見對於一個系統不是簡單地能實現其功能就可，而是要寫出高質量的SQL語句，提高系統的可用性。在多數情況下，Oracle使用索引來更快地遍歷表，優化器主要根據定義的索引來提高性能。但是，如果在SQL語句的where子句中寫的SQL代碼不合理，就會造成優化器刪去索引而使用全表掃描，一般就這種SQL語句就是所謂的劣質SQL語句。在編寫SQL語句時我們應清楚優化器根據何種原則來刪除索引，這有助於寫出高性能的SQL語句。二、SQL語句編寫註意問題下麵就某些SQL語句的where子句編寫中需要註意的問題作詳細介紹。在這些where子句中，即使某些列存在索引，但是由於編寫了劣質的SQL，系統在運行該SQL語句時也不能使用該索引，而同樣使用全表掃描，這就造成了響應速度的極大降低。 1. IS NULL 與 IS NOT NULL 不能用null作索引，任何包含null值的列都將不會被包含在索引中。即使索引有多列這樣的情況下，只要這些列中有一列含有null，該列就會從索引中排除。也就是說如果某列存在空值，即使對該列建索引也不會提高性能。任何在where子句中使用is null或is not null的語句優化器是不允許使用索引的。 2. 聯接列對於有聯接的列，即使最後的聯接值為一個靜態值，優化器是不會使用索引的。我們一起來看一個例子，假定有一個職工表（employee），對於一個職工的姓和名分成兩列存放（FIRST_NAME和LAST_NAME），現在要查詢一個叫比爾.柯林頓（Bill Cliton）的職工。下麵是一個採用聯接查詢的SQL語句， select * from employss where first_name||''||last_name ='Beill Cliton'; 上面這條語句完全可以查詢出是否有Bill Cliton這個員工，但是這裡需要註意，系統優化器對基於last_name創建的索引沒有使用。當採用下麵這種SQL語句的編寫，Oracle系統就可以採用基於last_name創建的索引。 Select * from employee where first_name ='Beill' and last_name ='Cliton'; 遇到下麵這種情況又如何處理呢？如果一個變數（name）中存放著Bill Cliton這個員工的姓名，對於這種情況我們又如何避免全程遍歷，使用索引呢？可以使用一個函數，將變數name中的姓和名分開就可以了，但是有一點需要註意，這個函數是不能作用在索引列上。下麵是SQL查詢腳本： select * from employee where first_name = SUBSTR('&&name',1,INSTR('&&name',' ')-1) and last_name = SUBSTR('&&name',INSTR('&&name’,' ')+1) 3. 帶通配符（%）的like語句同樣以上面的例子來看這種情況。目前的需求是這樣的，要求在職工表中查詢名字中包含cliton的人。可以採用如下的查詢SQL語句： select * from employee where last_name like '%cliton%'; 這裡由於通配符（%）在搜尋詞首出現，所以Oracle系統不使用last_name的索引。在很多情況下可能無法避免這種情況，但是一定要心中有底，通配符如此使用會降低查詢速度。然而當通配符出現在字元串其他位置時，優化器就能利用索引。在下麵的查詢中索引得到了使用： select * from employee where last_name like 'c%'; 4. Order by語句 ORDER BY語句決定了Oracle如何將返回的查詢結果排序。Order by語句對要排序的列沒有什麼特別的限制，也可以將函數加入列中（象聯接或者附加等）。任何在Order by語句的非索引項或者有計算表達式都將降低查詢速度。仔細檢查order by語句以找出非索引項或者表達式，它們會降低性能。解決這個問題的辦法就是重寫order by語句以使用索引，也可以為所使用的列建立另外一個索引，同時應絕對避免在order by子句中使用表達式。 5. NOT 我們在查詢時經常在where子句使用一些邏輯表達式，如大於、小於、等於以及不等於等等，也可以使用and（與）、or（或）以及not（非）。NOT可用來對任何邏輯運算符號取反。下麵是一個NOT子句的例子： ... where not (status ='VALID') 如果要使用NOT，則應在取反的短語前面加上括弧，併在短語前面加上NOT運算符。NOT運算符包含在另外一個邏輯運算符中，這就是不等於（<>）運算符。換句話說，即使不在查詢where子句中顯式地加入NOT詞，NOT仍在運算符中，見下例： ... where status <>'INVALID'; 再看下麵這個例子： select * from employee where salary<>3000; 對這個查詢，可以改寫為不使用NOT： select * from employee where salary<3000 or salary>3000; 雖然這兩種查詢的結果一樣，但是第二種查詢方案會比第一種查詢方案更快些。第二種查詢允許Oracle對salary列使用索引，而第一種查詢則不能使用索引。 6. IN和EXISTS 有時候會將一列和一系列值相比較。最簡單的辦法就是在where子句中使用子查詢。在where子句中可以使用兩種格式的子查詢。第一種格式是使用IN操作符： ... where column in(select * from ... where ...); 第二種格式是使用EXIST操作符： ... where exists (select 'X' from ...where ...); 我相信絕大多數人會使用第一種格式，因為它比較容易編寫，而實際上第二種格式要遠比第一種格式的效率高。在Oracle中可以幾乎將所有的IN操作符子查詢改寫為使用EXISTS的子查詢。第二種格式中，子查詢以‘select 'X'開始。運用EXISTS子句不管子查詢從表中抽取什麼數據它只查看where子句。這樣優化器就不必遍歷整個表而僅根據索引就可完成工作（這裡假定在where語句中使用的列存在索引）。相對於IN子句來說，EXISTS使用相連子查詢，構造起來要比IN子查詢困難一些。通過使用EXIST，Oracle系統會首先檢查主查詢，然後運行子查詢直到它找到第一個匹配項，這就節省了時間。Oracle系統在執行IN子查詢時，首先執行子查詢，並將獲得的結果列表存放在在一個加了索引的臨時表中。在執行子查詢之前，系統先將主查詢掛起，待子查詢執行完畢，存放在臨時表中以後再執行主查詢。這也就是使用EXISTS比使用IN通常查詢速度快的原因。同時應儘可能使用NOT EXISTS來代替NOT IN，儘管二者都使用了NOT（不能使用索引而降低速度），NOT EXISTS要比NOT IN查詢效率更高。