中心極限定理實踐

原創

2020-02-20 19:20

呈任意分佈的樣本，進行m次抽樣，每次取n個。這m次抽樣的平均值接近正態分佈。

下面我們驗證一下：

數據：用戶粉絲數

我們有約100w用戶的信息，我們只關注用戶的粉絲數這個字段。毫無疑問用戶的粉絲數都是長尾分佈，如圖：

import pandas as pd
import random

def get_user_sample(data):
    sample = []
    sample_mean = []
    for j in range(0,1000):#1000次取樣
        sum = 0
        for i in range(0, 30):#每次取30個
            r = random.randint(0,data.size)
            sample.append(data[r:r+1])#取一條
            print('隨機值%d 取值%d'% (r, sample[len(sample)-1].values[0]))
            sum = sum+sample[len(sample)-1].values[0]
        print(sum/10)
        sample_mean.append(sum/10)
    return sample_mean

if __name__ == '__main__':
    df = pd.read_csv('用戶點贊粉絲數5.csv')
    df.info()
    df_filter=df[df.fans<500] #篩選
    df_filter.info()#查看錶結構
    df_fans = df_filter['fans']#只用fans字段
    sample = get_user_sample(df_fans)
    plt.hist(df_fans, bins=100)#顯示 原來樣本分佈   分成100個桶，這個參數指定bin(箱子)的個數,也就是總共有幾條條狀圖
    plt.hist(sample, bins=100)#顯示 採樣分佈

看起來也算是有點像正態分佈吧。實踐一下，加深理解。

參考資料：https://blog.csdn.net/mingyuli/article/details/81141758

發佈了18 篇原創文章 · 獲贊 7 · 訪問量 4萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

HDU-1205(喫糖果)

喫糖果 Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others) Total Submission(s): 32022

2020-07-08 12:17:52

【hdoj 1164】Eddy's research I

Eddy's research I Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submission(s):

2020-07-08 09:49:59

伊甸園日曆遊戲(vijos--1004)

題目： Adam和Eve玩一個遊戲，他們先從1900.1.1到2001.11.4這個日期之間隨意抽取一個日期出來。然後他們輪流對這個日期進行操作： 1 ：把日期的天數加1，例如1900.1.1變到1900.1.2 2 ：把月份

2020-07-08 09:20:48

對角化的一題

超级大超越

2020-07-08 09:04:38

找規律·Number Game ZOJ - 3346

題目大意：A和B做遊戲規則是：首先給定了N0，A選擇一個數a（N0≤a≤N0^2）,B選擇一個數b，保證a/b 是一個素數的正數次冪。下一次遊戲，將b作爲N0，繼續；若A能選到1990，則A贏，若B能選到1則B贏。A，B走的都是最優策略，

2020-07-08 06:28:56

LeetCode題解(1431)：擁有最多糖果的孩子(Python)

題目：原題鏈接（簡單）解法時間複雜度空間複雜度執行用時 Ans 1 (Python) O(N)O(N)O(N) O(1)O(1)O(1) 44ms (54.21%) Ans 2 (Python)

2020-07-08 05:30:43

LeetCode題解(1413)：逐步求和得到正數的最小值(Python)

題目：原題鏈接（簡單）標籤：簡單數學解法時間複雜度空間複雜度執行用時 Ans 1 (Python) O(N)O(N)O(N) O(1)O(1)O(1) 48ms (39.32%) Ans 2 (Pyth

2020-07-08 05:30:38

loj#2325. 「清華集訓 2017」小 Y 和恐怖的奴隸主（矩陣快速冪優化概率dp）

吐槽請無視哇塞我終於開始更博客了！感不感動！興不興奮！%￥#%$#@*&.... emm事實上是因爲csdn的LaTeX終於修復好了。。 ps. 之後的題解可能都會相對簡略。並且養成標題上加算法的好習慣，，題面在這裏

2020-07-08 05:07:32

closed-form solution 是啥

轉自： https://www.cnblogs.com/vive/p/5006552.html 轉載出處：學習筆記解析解(Analytical solution) 就是根據嚴格的公式推導，給出任意的自變量就可以求出其因變量，

2020-07-08 05:05:11

AI筆記: 數學基礎之定積分的性質

定積分的性質設所列定積分都存在 (1) ∫abf(x)dx=−∫baf(x)dx⇒∫aaf(x)dx=0\int_a^b f(x) dx = - \int_b^a f(x) dx \Rightarrow \int_a^a f(x

2020-07-08 03:49:20

AI筆記: 數學基礎之方向導數的計算和梯度

方向導數定理若函數f(x,y,z)在點P(x,y,z)處可微，沿任意方向l的方向導數 ∂f∂l=∂f∂xcosα+∂f∂ycosβ+∂f∂zcosγ\frac{\partial f}{\partial l} = \frac{

2020-07-08 03:49:20

AI筆記: 數學基礎之定積分的引例與定義

概述積分學不定積分定積分定積分舉例 1 ）矩形和梯形備註：圖片託管於github，請確保網絡的可訪問性矩形面積：S=ahS = ahS=ah 梯形面積：S=h2(a+b)S = \frac{h}{

2020-07-08 03:11:45

深度之眼《數據基礎訓練營》筆記

文|Seraph 01 | 線性代數一、矩陣及其運算合集矩陣及其運算。方陣、行向量、列向量、兩個矩陣相等、零矩陣矩陣是一種陣列的表示：圖像、線性變換等。單位矩陣、對角矩陣diag 矩陣的乘法不滿足交換律。矩陣沒有除法

2020-07-08 00:56:51

記一次大數整除

除法其實也是減法（應該可以這樣說），那麼大數除法中，該如何判斷一個大數能否被其它數整除呢？（這裏說的數指自然數）比如 a(=100000000000000000000000)，就不能被 b(=333)整除，（但是計算機硬件不支持這次計算

2020-07-08 00:38:49

CSU 1303: Decimal

Description 任意一個分數都是有理數，對於任意一個有限小數，我們都可以表示成一個無限循環小數的形式(在其末尾添加0)，對於任意一個無限循環小數都可以轉化成一個分數。現在你的任務就是將任意一個無限循環小數轉化成既約分數形

2020-07-08 00:16:47

24小時熱門文章

最新文章

最新評論文章