1.前言
測試數據中,需要用到隨機數據,同時要求數據不能重複。所以最終想到了洗牌的方式來生成測試數據,也就是大名鼎鼎的shuffle算法。
2.相關知識
2.1 算法描述
考慮了不需要額外地申請空間,所以需要再數組內部進行調整。
for i=1 to n do swap( a[i], a[random(i,n)] );
2.2 數學證明
數學歸納法證明,隨機數據爲平均分佈:
- 當n=1時,所以元素arr[0]在任何一個位置的概率爲1/1,命題成立;
- 假設當n=k時,命題成立,即原數組中任何一個元素在任何一個位置的概率爲1/k;
- 則當n=k+1時,當算法執行完k次時,前k個元素在前k個位置的概率均爲1/k;
- 當執行最後一步時,前k個元素中任何一個元素被替換到第k+1位置的概率爲:(1-1/(k+1)) * 1/k = 1/(k+1);
- 在前面k個位置任何一個位置的概率爲(1-1/(k+1)) * 1/k = 1/(k+1);
- 對於第k+1個元素,其在原位置的概率爲1/k+1,在前k個位置任何一個位置的概率爲:(1-k /(k+1)) * (1/k) = 1/(k+1);
- 所以對於第k+1個元素,其在整個數組前k+1個位置上的概率也均爲1/k+1;
綜上所述,對於任意n,只要按照方案中的方法,即可滿足每個元素在任何一個位置出現的概率均爲1/n。
3.實現
基礎數組申請:
static inline u32 *
__integer_array_alloc(u32 min, u32 max)
{
u32 ix = 0;
u32 *parry = NULL;
size_t nmemb = max - min + 1;
parry = (u32 *)malloc(nmemb * sizeof(u32));
if (!parry) {
return NULL;
}
for (ix = 0; ix < nmemb; ix++) {
parry[ix] = min + ix;
}
return parry;
}
洗牌,選取 roll
rear
兩個位置,進行交換。但要注意的是 rand()
獲取的其實是僞隨機數。某些安全場景下需要換爲真隨機數
。
static inline void
__integer_array_shuffle(u32 *parry, size_t nmemb)
{
u32 ix = 0;
u32 roll = 0;
u32 rear = 0;
for (ix = 0; ix < nmemb; ix++) {
roll = rand() % (nmemb - ix);
rear = nmemb - ix - 1;
if (roll == rear) {
continue;
}
/* Swap */
parry[roll] = parry[roll] ^ parry[rear];
parry[rear] = parry[roll] ^ parry[rear];
parry[roll] = parry[roll] ^ parry[rear];
}
}
爲了方便查看效果,加一個打印函數
static inline void
__integer_array_display(u32 *parry, size_t nmemb)
{
printf("---------------------------------------------\n");
u32 ix = 0;
for (ix = 0; ix < nmemb; ix++) {
printf("%4d ", parry[ix]);
if (((ix + 1) & 0x7) == 0) {
printf("\n");
}
}
printf("\n");
printf("---------------------------------------------\n");
}
所以,最終封裝的函數如下:
u32 *utils_random_sequence_alloc(u32 min, u32 max)
{
u32 *parry = NULL;
if (max <= min) {
printf("Input error\n");
return NULL;
}
parry = __integer_array_alloc(min, max);
__integer_array_display(parry, max - min + 1);
__integer_array_shuffle(parry, max - min + 1);
__integer_array_display(parry, max - min + 1);
return parry;
}
生成100個隨機數據,執行結果如下:
---------------------------------------------
0 1 2 3 4 5 6 7
8 9 10 11 12 13 14 15
16 17 18 19 20 21 22 23
24 25 26 27 28 29 30 31
32 33 34 35 36 37 38 39
40 41 42 43 44 45 46 47
48 49 50 51 52 53 54 55
56 57 58 59 60 61 62 63
64 65 66 67 68 69 70 71
72 73 74 75 76 77 78 79
80 81 82 83 84 85 86 87
88 89 90 91 92 93 94 95
96 97 98 99 100
---------------------------------------------
---------------------------------------------
36 25 30 75 52 44 89 12
27 29 6 21 13 63 84 0
41 22 81 79 7 28 83 47
57 66 11 46 43 15 18 40
4 39 70 71 14 77 64 97
96 95 10 38 100 60 88 20
69 26 68 53 16 56 61 17
90 65 73 33 76 92 58 24
23 98 74 34 51 42 49 55
9 59 62 93 37 87 19 82
8 54 80 85 45 78 94 3
35 67 2 1 48 50 99 31
91 5 72 86 32
---------------------------------------------
4. 結論
本章介紹的shuffle算法爲非常好理解且實現簡單的算法,在項目實用性非常強。同樣的在c++中,也有std::random_shuffle
的實用方法。
————————————————
參考文章:
[1]:https://blog.csdn.net/cyningsun/article/details/7545679
[2]:https://blog.csdn.net/y417244146/article/details/46819091