有趣的算法（七）：3分鐘看懂希爾排序（C語言實現）

本帖轉載自：http://www.javaxxz.com/thread-359465-1-1.html

在上一次的算法討論中，我們一起學習了直接插入排序。它的原理就是把前i個長度的序列變成有序序列,然後循環迭代,直至整個序列都變爲有序的.但是說來說去它還是一個時間複雜度爲(n^2)的算法,難道就不能再進一步把時間複雜度降低一階麼?
確實,以上幾種算法相對於之前的O(n^2)級別的算法真的是弱,效率可能還會差上千萬倍,但是我們不妨翻看一下歷史,你就會感覺每一種算法的出現都是很可貴的。

一、算法思想
希爾排序是希爾（Donald Shell）於1959年提出的一種排序算法。希爾排序也是一種插入排序，它是簡單插入排序經過改進之後的一個更高效的版本，也稱爲縮小增量排序，同時該算法是衝破O(n2）的第一批算法之一。因爲在1959年之前的相當長的一段時間裏,各種各樣的排序算法無論是怎麼花樣繁多,都始終無法突破O(n^2),在當時直接插入排序已經是相當優秀的了,而排序算法不可能突破O(n^2)的聲音成爲了當時的主流。希爾排序的出現帶來了新的希望。
該方法的基本思想是：先將整個待排元素序列切割成若干個子序列（由相隔某個“增量”的元素組成的）分別進行直接插入排序，然後依次縮減增量再進行排序，待整個序列中的元素基本有序（增量足夠小）時，再對全體元素進行一次直接插入排序。由於直接插入排序在元素基本有序的情況下（接近最好情況），效率是非常高的，因此希爾排序在時間效率上比前兩種方法有較大提高。

希爾排序是基於插入排序的以下兩點性質而提出改進方法的：


插入排序在對幾乎已經排好序的數據操作時，效率高，即可以達到線性排序的效率。
但插入排序一般來說是低效的，因爲插入排序每次只能將數據移動一位。


增量的選擇：在每趟的排序過程都有一個增量，至少滿足一個規則增量關係 d[1] > d[2] > d[3] >..> d[t] = 1 (t趟排序)；根據增量序列的選取其時間複雜度也會有變化，這個不少論文進行了研究，在此處就不再深究。本文采用增量爲n/2,以此遞推，每次增量爲原先的1/2，直到增量爲1。 

希爾排序的排序效率和選擇步長序列有直接關係，從length逐步減半，這還不算最快的希爾，有幾個增量在實踐中表現更出色，具體可以看weiss的數據結構書，同時裏面有希爾排序複雜度的證明，但是涉及組合數學和數論，希爾排序是實現簡單但是分析極其困難的一個算法的例子。目前最好的序列是塞奇威克（Sedgewick）的步長序列（摘自維基百科）

  希爾（Shell）原始步長序列：N / 2，N / 4，...，1（重複除以2）
  希伯德（Hibbard）的步長序列：1，3，7，...，2 k - 1
  克努特（Knuth）的步長序列：1，4，13，...，（3 k - 1）/ 2
  塞奇威克（Sedgewick）的步長序列：1，5，19，41，109

二、算法步驟
算法步驟可以簡單分爲：

  用增量進行分組
  對每組進行插入排序

舉個例子，按步長序列 [1,3,5，...] 對數組[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ] 進行希爾排序,首先按步長爲5 進行分組，每行爲一個分組得到：

  13   25   45   10

  14   59   27

  94   94   73

  33   65   25

  82   23   39

然後對每行分組進行排序得到：

  10   13   25   45 

  14   27   59

  73   94   94

  25   33   65

  23   39   82 
 

然後再按步長爲3進行分組，每行爲一個分組得到：

  10   25   27   39   94   45 

  14   23   94   25   65

  73   13   33   59   82

對每行分組進行排序得到：

  10   25   27   39   45   94 

  14   23   25   65   94

  13   33   59   73   82
 

此時數組如下所示，可以看到，元素本身已經基本有序了，此時插入排序的效率可以達到最高

[ 10 14 13 25 23 33 27 25 59 39 65 73 45 94 82 94 ]

看起來比直接分組排序多了些步驟，而實際上是讓一些小數跳過了一些比較和交換操作，直接從後面跳到了前面，從而提高了效率。下面這個動態圖形象的解釋了希爾排序的過程：

三、算法分析
希爾排序中對於增量序列的選擇十分重要，直接影響到希爾排序的性能。我們上面選擇的增量序列{n/2,(n/2)/2...1}(希爾增量)，其最壞時間複雜度依然爲O(n2)，一些經過優化的增量序列如Hibbard經過複雜證明可使得最壞時間複雜度爲O(n3/2)






排序方法
時間複雜度
空間複雜度
穩定性
複雜性

平均情況
最壞情況
最好情況

Shell 排序
O(n3/2n3/2)
O(n2n2)
O(n)
O(1)
不穩定
較複雜



（上面這個我引用的圖空間複雜度有問題，原來是O(N)，我修改了，其實應該是O(1)）
對於希爾排序的一個理解，我覺得知乎上有個答主說的很好，從本質上剖析了高效算法之所以高效的原因：

希爾能突破O(N^2)的界，可以用逆序數來理解，假設我們要從小到大排序，一個數組中取兩個元素如果前面比後面大，則爲一個逆序，容易看出排序的本質就是消除逆序數，可以證明對於隨機數組，逆序數是O(N^2)的，而如果採用“交換相鄰元素”的辦法來消除逆序，每次正好只消除一個，因此必須執行O(N^2)的交換次數，這就是爲啥冒泡、插入等算法只能到平方級別的原因，反過來，基於交換元素的排序要想突破這個下界，必須執行一些比較，交換相隔比較遠的元素，使得一次交換能消除一個以上的逆序，希爾、快排、堆排等等算法都是交換比較遠的元素，只不過規則各不同罷了。

四、算法實現
代碼在VC++環境下編譯通過