title: python簡易數據分析
tags: [python, 數據分析]
python簡易數據分析
1、平均數(Average)
話不多說,直接上代碼
def average(data):
sum_ = sum(data) # 調用內置求和函數
a_val = sum_ / len(data)
return a_val
2、方差(Variance)
何謂方差?
方差是在概率論和統計方差衡量隨機變量或一組數據時離散程度的度量。概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度。統計中的方差(樣本方差)是每個樣本值與全體樣本值的平均數之差的平方值的平均數。在許多實際問題中,研究方差即偏離程度有着重要意義。
—— 百度百科
代碼
def variance(data):
a_val = average(data)
var = 0
for i in data:
var += abs(a_val - i) ** 2
var /= len(data)
return a_val
平均差(Mean Deviation)
何謂平均差
平均差(Mean Deviation)是表示各個變量值之間差異程度的數值之一。指各個變量值同平均數的離差絕對值的算術平均數。
平均差異大,表明各標誌值與算術平均數的差異程度越大,該算術平均數的代表性就越小;平均差越小,表明各標誌值與算術平均數的差異程度越小,該算術平均數的代表性就越大。因離差和爲零,離差的平均數不能將離差和除以離差的個數求得,而必須將離差取絕對數來消除正負號。平均差是反應各標誌值與算術平均數之間的平均差異。
——百度百科
代碼
def mean(data):
a_val = average(data)
var = 0
for i in data:
var += abs(a_val - i)
var /= len(data)
return var
標準差(Standard Deviation)
何謂標準差
標準差(Standard Deviation) ,是離均差平方的算術平均數的平方根,用σ表示。在概率統計中最常使用作爲統計分佈程度上的測量。標準差是方差的算術平方根。標準差能反映一個數據集的離散程度。平均數相同的兩組數據,標準差未必相同。
——百度百科
代碼
from math import sqrt
def sd(data):
v = sqrt(variance(data))
return v
極差(Range)
這就更不用說啦!
def range_(data):
max_ = max(data)
min_ = min(data)
return max_ - min_
完整代碼
完整代碼如下所示(PEP通過)
from math import sqrt
def average(data):
sum_ = sum(data)
a_val = sum_ / len(data)
return a_val
def variance(data):
a_val = average(data)
var = 0
for i in data:
var += abs(a_val - i) ** 2
var /= len(data)
return a_val
def mean(data):
a_val = average(data)
var = 0
for i in data:
var += abs(a_val - i)
var /= len(data)
return var
def sd(data):
v = sqrt(variance(data))
return v
def range_(data):
max_ = max(data)
min_ = min(data)
return max_ - min_
首發於我的網站https://xiezheyuan.top/