歡迎使用CSDN-markdown編輯器

最近一個朋友和我探討關於Where 1=1 and這種形式的語句會不會影響性能。最後結論是不影響。

雖然結論正確，但對問題的認識卻遠遠沒有解決問題的根本。實際上在T-SQL語句的書寫過程中經常犯得錯誤就是得出一個很窄的結論，然後教條式的奉若聖經，對於T-SQL領域來說，在網上經常可以看到所謂的優化守則，隨便在網上搜了一些摘錄如下：

不要有超過5個以上的表連接（JOIN）
考慮使用臨時表或表變量存放中間結果
少用子查詢
視圖嵌套不要過深,一般視圖嵌套不要超過2個爲宜。
對出現在where子句中的字段加索引
避免在索引列上使用函數或計算，在where子句中，如果索引是函數的一部分，優化器將不再使用索引而使用全表掃描
在insert和update維表時都加上一個條件來過濾維表中已經存在的記錄
如果使用了IN或者OR等時發現查詢沒有走索引，使用顯式申明指定索引
EXISTS要遠比IN的效率高。
……….
問題出在哪了?
雖然上述指導意見看上去沒什麼問題，也不能說完全不正確，但實際上有兩個重大問題：

脫離上下文：很多道理只能在一個上下文範圍內生效，脫離了上下文範圍就毫無意義。舉個例子，平常有人對你說你有點腎虛，我想你的第一反應肯定是想辦法捍衛男人的尊嚴了，但如果你去醫院檢查醫生這麼說，那你可能就會一臉虔誠的求教如何補了：-），那舉上述摘錄的語句例子：1）少用子查詢，如果在SQL Server操作XML的XPATH按節點屬性篩選的時候，那轉換成子查詢一定會更快 2）如果使用了IN或者OR等時發現查詢沒有走索引，使用顯式申明指定索引，這種情況查詢分析器不走索引一定會有其原因，



不解釋本質原因：佛語有云“凡所有相,皆是虛妄,若見諸相非相,即見如來”。請看下面故事:

說有一次兩個府吏一起來看病，一個叫倪尋，一個叫李延，兩人的症狀也一樣，都是頭痛，身上發熱，也許都是感冒吧。而華佗卻說：“倪尋應當用下法來治，李延應當用汗法來治（尋當下之，延當發汗）。”旁人認爲很奇怪，大家也一定認爲很奇怪吧，爲什麼同樣的一個病，同樣的症狀，會有不同的治療法子呢？華佗解釋了，他說：“倪尋是外實，而立延是內實，所以用了不同的法子。”果然，第二天，他們兩的病都好了。

其實可以看出，完全同樣的症狀，可以是完全不同的原因，反之，同樣的原因，也可以形成完全不同的“相”。如果僅僅是看到“相”而採取應激處理措施，往往結果會不盡人意。

hink Like Query Optimizer
在每一個領域都有其領域內的規則，最簡單來說，如果你不符合C#規範去編程，比如錯誤的使用關鍵字，那麼編譯就會報錯。當然，每一個領域內還會有一些隱藏的規則，也有人會說是所謂的“潛規則”，這類規則往往不在明面上，比如說你不符合最佳實踐編寫一段程序，編譯不會報錯，但因此而引起的性能或是安全性問題就是你需要遵循最佳實踐這個“潛規則”才能避免。

而在SQL Server領域，T-SQL語句到查詢結果返回需要經歷一個完整的週期，如圖1：

圖1.T-SQL生命週期

因此，在關係數據庫領域，SQL語句的寫法只是一個抽象的邏輯，而不是像編程語言那樣直接的實現。比如說訪問一行數據，如果是編程語言實現，就需要指定連接數據的方式，打開數據，按某個方式取出數據，最後還要關閉連接，而在SQL Server中，T-SQL僅僅是定義如何去獲取所需的數據，而無需考慮實現細節。

圖1中從T-SQL到具體返回數據經歷了多個步驟，每一個步驟又存在大量的規則。因此在本文提到Where 1=1 and引起的性能問題就需要按照查詢分析器的規則去考慮爲什麼，這也是Think like query optimizer。



在SQL Server中，T-SQL需要編譯爲執行計劃才能去執行，在編譯過程中，Query Optimizer需要考慮很多元數據，比如說表上的索引、數據分佈、估計行數、一些參數配置、硬件環境等，在這其中，最重要的就是估計行數，SQL Server需要估計行數來估計成本。

Where 1=1 and寫法爲什麼不會變慢?

因爲查詢分析器在代數樹優化階段就把1=1 直接給過濾掉了。這個功能就是查詢優化器中所謂的“Constant Folding”。


我們這裏假設查詢分析器在代數樹優化階段沒有把where 1=1這種情況直接過濾掉。

比如語句select * from table where a=1 and b=2 這個語句，SQL Server估計的行數會是：

a列的選擇率*b列的選擇率*表中採樣的總行數

因此，當Where 1=1 and a=1時，結果就變爲

 1*a列的選擇率 *表中採樣的總行數=a列的選擇率 *表中採樣的總行數



因此無論是否有1=1 and，查詢分析器都會估計相同的行數，從而擁有同樣的執行計劃，因此不影響性能。



當我們明白了查詢分析器對A and B這種寫法是如何估計行數之後，那麼我們就可以推算出什麼情況A and B可能引起執行計劃不準確。從公式來看，SQL Server認爲A列和B列是無關聯的，如果A和B關聯很大，那麼估計的行數一定會非常不準。

這裏我們舉例，假如表中有100萬行數據，where a=1的數據有1萬條，where b=1的數據有1萬條，則A和B的選擇性都是1/100=0.01，在Where中A And B聯合的估計行數則變爲0.01*0.01=0.0001*100萬=100行，假設where a=1 和b=1所篩選的數據爲同樣的1萬行數據，則估計行數爲100而實際行數爲1萬，則可能引起執行計劃的不準確，從而引起性能問題。當然，這種情況的確是少數，但發生後往往對性能有一定影響，因此SQL Server 2014新的行數估計採用了指數退讓算法，在這種情況下就會估計爲1000行，從而引起性能問題的可能性會變小，2014指數退讓算法不是本文的重點，因此也不多講了。

歡迎使用CSDN-markdown編輯器

iOS深入學習（創建靜態庫static library）

Android利用Context獲取屏幕尺寸

IOS 將RGB顏色值轉換爲UIColor

EditText無法獲取焦點獲取焦點無法編輯（android:descendantFocusability用法簡析）

ios 字符串判斷代碼

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結