1.前言

測試數據中，需要用到隨機數據，同時要求數據不能重複。所以最終想到了洗牌的方式來生成測試數據，也就是大名鼎鼎的shuffle算法。

2.相關知識

2.1 算法描述

考慮了不需要額外地申請空間，所以需要再數組內部進行調整。

for i=1 to n do swap( a[i], a[random(i,n)] );

2.2 數學證明

數學歸納法證明，隨機數據爲平均分佈：

當n=1時，所以元素arr[0]在任何一個位置的概率爲1/1，命題成立；

假設當n=k時，命題成立，即原數組中任何一個元素在任何一個位置的概率爲1/k；

則當n=k+1時，當算法執行完k次時，前k個元素在前k個位置的概率均爲1/k；

當執行最後一步時，前k個元素中任何一個元素被替換到第k+1位置的概率爲：(1-1/(k+1)) * 1/k = 1/(k+1)；

在前面k個位置任何一個位置的概率爲(1-1/(k+1)) * 1/k = 1/(k+1)；

對於第k+1個元素，其在原位置的概率爲1/k+1，在前k個位置任何一個位置的概率爲：(1-k /(k+1)) * (1/k) = 1/(k+1)；

所以對於第k+1個元素，其在整個數組前k+1個位置上的概率也均爲1/k+1；

綜上所述，對於任意n，只要按照方案中的方法，即可滿足每個元素在任何一個位置出現的概率均爲1/n。

3.實現

基礎數組申請：

static inline u32 *
__integer_array_alloc(u32 min, u32 max)
{
    u32 ix = 0;
    u32 *parry = NULL;
    size_t nmemb = max - min + 1;

    parry = (u32 *)malloc(nmemb * sizeof(u32));
    if (!parry) {
        return NULL;
    }

    for (ix = 0; ix < nmemb; ix++) {
        parry[ix] = min + ix;
    }

    return parry;
}

洗牌，選取 roll rear 兩個位置，進行交換。但要注意的是 rand() 獲取的其實是僞隨機數。某些安全場景下需要換爲真隨機數。

static inline void
__integer_array_shuffle(u32 *parry, size_t nmemb)
{
    u32 ix = 0;
    u32 roll = 0;
    u32 rear = 0;

    for (ix = 0; ix < nmemb; ix++) {
        roll = rand() % (nmemb - ix);
        rear = nmemb - ix - 1;

        if (roll == rear) {
            continue;
        }

        /* Swap */
        parry[roll] = parry[roll] ^ parry[rear];
        parry[rear] = parry[roll] ^ parry[rear];
        parry[roll] = parry[roll] ^ parry[rear];
    }
}

爲了方便查看效果，加一個打印函數

static inline void
__integer_array_display(u32 *parry, size_t nmemb)
{
    printf("---------------------------------------------\n");
    u32 ix = 0;
    for (ix = 0; ix < nmemb; ix++) {
        printf("%4d ", parry[ix]);
        if (((ix + 1) & 0x7) == 0) {
            printf("\n");
        }
    }
    printf("\n");
    printf("---------------------------------------------\n");
}

所以，最終封裝的函數如下：

u32 *utils_random_sequence_alloc(u32 min, u32 max)
{
    u32 *parry = NULL;

    if (max <= min) {
        printf("Input error\n");
        return NULL;
    }

    parry = __integer_array_alloc(min, max);
    __integer_array_display(parry, max - min + 1);
    __integer_array_shuffle(parry, max - min + 1);
    __integer_array_display(parry, max - min + 1);
    return parry;
}

生成100個隨機數據，執行結果如下：

---------------------------------------------
   0    1    2    3    4    5    6    7
   8    9   10   11   12   13   14   15
  16   17   18   19   20   21   22   23
  24   25   26   27   28   29   30   31
  32   33   34   35   36   37   38   39
  40   41   42   43   44   45   46   47
  48   49   50   51   52   53   54   55
  56   57   58   59   60   61   62   63
  64   65   66   67   68   69   70   71
  72   73   74   75   76   77   78   79
  80   81   82   83   84   85   86   87
  88   89   90   91   92   93   94   95
  96   97   98   99  100
---------------------------------------------
---------------------------------------------
  36   25   30   75   52   44   89   12
  27   29    6   21   13   63   84    0
  41   22   81   79    7   28   83   47
  57   66   11   46   43   15   18   40
   4   39   70   71   14   77   64   97
  96   95   10   38  100   60   88   20
  69   26   68   53   16   56   61   17
  90   65   73   33   76   92   58   24
  23   98   74   34   51   42   49   55
   9   59   62   93   37   87   19   82
   8   54   80   85   45   78   94    3
  35   67    2    1   48   50   99   31
  91    5   72   86   32
---------------------------------------------

4. 結論

本章介紹的shuffle算法爲非常好理解且實現簡單的算法，在項目實用性非常強。同樣的在c++中，也有std::random_shuffle的實用方法。

————————————————
參考文章：
[1]：https://blog.csdn.net/cyningsun/article/details/7545679
[2]：https://blog.csdn.net/y417244146/article/details/46819091

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

c語言數組洗牌的實現

1.前言

2.相關知識

2.1 算法描述

2.2 數學證明

3.實現

4. 結論

Linux下TCP非阻塞連接的方法

Linux下使用readline庫編程實現多級CLI菜單

Linux下對libevent的evbuffer模塊裁剪移植

c語言數據結構應用-數組隊列（無鎖隊列）在多線程中的使用

c語言命令行-勇者鬥惡龍

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結