在进行数据分析处理的过程中,经常需要判断数据是否符合正太分布,正常的正太分布检验费时费力,本文介绍如何通过python快速实现对正太分布的检验:
前方高能!!!看如何一行代码实现数据的正太分布检验
from scipy import stats
# scipy包是一个高级的科学计算库,它和Numpy联系很密切,Scipy一般都是操控Numpy数组来进行科学计算
data = [-15, 15, 9]#需要检验的数据
stats.kstest(data, 'norm') #正太分布检验
输出:
Out[24]: KstestResult(statistic=0.66666666666666674, pvalue=0.074074074074073959)
输出结果分析
statistic为KS统计量,pvalue 为P值,当pvalue > 0.05时,服从正太分布
函数详解:
kstest(rvs, cdf, args=(), N=20, alternative='two-sided', mode='approx')
参数是:
rvs:待检验数据。
cdf:检验分布,kstest分布可以检验多种分布函数,例如'norm'正太分布,'expon'指数分布,'rayleigh'瑞利分布,'gamma'伽玛分布等分布,设置为'norm'时表示正态分布。
alternative:默认为双侧检验,可以设置为'less'或'greater'作单侧检验。
model:'approx'(默认值),表示使用检验统计量的精确分布的近视值;'asymp':使用检验统计量的渐进分布。