經典問題7:c/c++ 程序設計 ---0、1串個數統計問題

-------------------------------------------------------------------
經典問題7:c/c++ 程序設計 ---0、1串個數統計問題
-------------------------------------------------------------------
    (1)面試題:下面程序的結果是多少?
     1    #include <iostream>
     2    #include <string>
     3     
     4    using namespace std;
     5     
     6    int main()
     7    {
     8        int count = 0;
     9        int m=9999;
    10        while(m){
    11            count++;
    12            m=m&(m-1);
    13        }
    14        cout<<"the count of the number 1 is:"<<count<<endl;
    15        return 0;
    16    }
------------------
$ ./a.out
the count of the number 1 is:8
------------------
知識點:統計二進制數中1的個數;
拓展:問題:給出一個整數,請設計算法計算該整數以二進制格式表示時的1的個數。
例如,十進制整數150,二進制表示爲10010110,則1的個數爲4個。要求算法效率儘可能的高。
解答:
方法1:分別判斷各個位
--------------------------------------
int bit_count(unsigned int n)
{
    int count;
    for(count = 0; n; n >>= 1)
    {
        count += n & 1;
    }
    return count;
}
----------------------------------------
方法2:循環中直接計算1的數量
如何只數'1'的個數?
1)如果一個數字至少包含一個'1'位,那麼這個數字減1將從最低位開始依次向高位借位,
直到遇到第一個不爲'0'的位。依次借位使得經過的位由原來的'0'變爲'1',而第一個遇到的那個'1'位則被借位變爲'0'。
36 d = 100100 b
36-1 d = 100011 b
2)如果最低位本來就是'1',那麼沒有發生借位。
現在把這2個數字做按位與:n & n-1的結果是什麼?
2個數字在原先最低爲'1'的位以下(包括這個位)的部分都不同,所以結果是保留了其他的'1'位。
36 & 36-1 d = 100000 b
這個結果剛好去掉了最低的一個'1'位
----------------------------------
int bit_count(unsigned int n)
{
    int count;
    for(count = 0; n; n &= n - 1)
    {
        count++;
    }
    return count;
}
-------------------------------------

方法3:並行計算的
------------------------------------------------------------
#define POW(c) (1<<(c))
#define MASK(c) (((unsigned long)-1) / (POW(POW(c)) + 1))
#define ROUND(n, c) (((n) & MASK(c)) + ((n) >> POW(c) & MASK(c)))

int bit_count(unsigned int n)
{
    n = ROUND(n, 0);
    n = ROUND(n, 1);
    n = ROUND(n, 2);
    n = ROUND(n, 3);
    n = ROUND(n, 4);
    return n;
}
---------------------------------------------------------------
一下子看不明白,先把宏展開來:
POW是計算2的冪
MASK很奇怪,一個全1的無符號數字除以2的冪的冪加1?
好在打印出來還能看得懂:
------------------------------------------------------------
MASK(0) = 55555555 h = 01010101010101010101010101010101 b
MASK(1) = 33333333 h = 00110011001100110011001100110011 b
MASK(2) = 0f0f0f0f h = 00001111000011110000111100001111 b
MASK(3) = 00ff00ff h = 00000000111111110000000011111111 b
MASK(4) = 0000ffff h = 00000000000000001111111111111111 b
--------------------------------------------------------------
這些mask分別把32位數字劃分爲幾個部分。每個部分的前一半和後一半分別是全'0'和全'1'。
MASK(0)分爲16個部分,MASK(1)分爲8個部分,...
ROUND中對n的處理:(n & MASK) + (n >> POW & MASK)
POW的值剛好是MASK中連續'0'(或者連續'1')的長度。也就是說ROUND把由MASK分開的n的各個部分中的高POW位和低POW位相加。
爲了便於說明,取一個簡單的部分:MASK(1)的0011
假設n的值爲1001,那麼ROUND後的結果就是10 + 01 = 11 b,把這個結果賦值給n,這時n的含義由原來的二進制位串變爲'1'位的數量。
特別的,當ROUND(n, 0)時,把n當作一個32個部分各自'1'位的數量。('0'表示沒有'1',而'1'則表示有1個'1')
計算完n = ROUND(n, 0)後,n是一個16個部分各自'1'位數量的'數組',這個'數組'的每個元素只有2個二進制位。最大值爲2,足夠由2個二進制位來表示。
接下來,計算完n=ROUND(n,1)後,n是一個8個部分各自'1'位數量的'數組',這個'數組'的每個元素只有4個二進制位。
最大值爲4,足夠由4個二進制位來表示。(實際只需要3個二進制位)
...
最後一步,計算n=ROUND(n,4)後,n是一個1個部分各自'1'位數量的'數組',這個'數組'的每個元素有32個二進制位。
最大值爲32,足夠由32個二進制位來表示。(實際只需要6個二進制位)
這個代表32位內'1'位數量的32位二進制數也就是我們要求的結果。

這個方法的好處是只需要5步(log n (n=32)),並且沒有循環(或分支),流水線不會被打破。
下面舉例說明:
from:http://en.wikipedia.org/wiki/Hamming_weight

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章