基數排序

基數排序

http://hxraid.iteye.com/blog/648532

桶排序》中我們能夠看到,數據值的範圍越大,可能需要桶的個數也就越多,空間代價也就越高。對於上億單位的關鍵字,桶排序是很不實用的。基數排序是對桶排序的一種改進,這種改進是讓“桶排序”適合於更大的元素值集合的情況,而不是提高性能。

多關鍵字排序問題(類似於字典序):

我們先看看撲克牌的例子。一張牌有兩個關鍵字組成:花色(桃<心<梅<方)+面值(2<3<4<...<A)。假如一張牌的大小首先被花色決定,同花色的牌有數字決定的話。我們就有兩種算法來解決這個問題。

(1) 首先按照花色對所有牌進行穩定排序,這樣就可以將所有牌分成4組。然後同組的牌(同花色)再按照面值進行排序。

(2) 首先按照面值對所有牌進行穩定排序,然後按照花色再次對所有牌進行穩定排序。

顯然,第一種方法需要將序列分割成幾個子序列。而第二種方法則完全不需要。因此我們採用從次關鍵字排序開始的方法。

 

基數排序

上面的問題是多關鍵字的排序,但單關鍵字也仍然可以使用這種方式。

比如字符串“abcd” “aesc” "dwsc""rews"就可以把每個字符看成一個關鍵字。另外還有整數 425、321、235、432也可以每個位上的數字爲一個關鍵字。

基數排序的思想就是將待排數據中的每組關鍵字依次進行桶分配。比如下面的待排序列:

278、109、063、930、589、184、505、269、008、083

我們將每個數值的個位,十位,百位分成三個關鍵字: 278 -> k1(個位)=8 ,k2(十位)=7 ,k3=(百位)=2。

然後從最低位個位開始(從最次關鍵字開始),對所有數據的k1關鍵字進行桶分配(因爲,每個數字都是 0-9的,因此桶大小爲10),再依次輸出桶中的數據得到下面的序列。

930、063、083、184、505、278、008、109、589、269

再對上面的序列接着進行鍼對k2的桶分配,輸出序列爲:

505、008、109、930、063、269、278、083、184、589

最後針對k3的桶分配,輸出序列爲:

008、063、083、109、184、269、278、505、589、930

性能分析

很明顯,基數排序的性能比桶排序要略差。每一次關鍵字的桶分配都需要O(N)的時間複雜度,而且分配之後得到新的關鍵字序列又需要O(N)的時間複雜度。假如待排數據可以分爲d個關鍵字,則基數排序的時間複雜度將是O(d*2N),當然d要遠遠小於N,因此基本上還是線性級別的。基數排序的空間複雜度爲O(N+M),其中M爲桶的數量。一般來說N>>M,因此額外空間需要大概N個左右。

但是,對比桶排序,基數排序每次需要的桶的數量並不多。而且基數排序幾乎不需要任何比較操作,而桶排序在桶相對較少的情況下,桶內多個數據必須進行基於比較操作的排序。因此,在實際應用中,基數排序的應用範圍更加廣泛。
發佈了231 篇原創文章 · 獲贊 36 · 訪問量 142萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章