數據分析檢驗

單樣本檢驗/假設檢驗
d1 = sm.stats.DescrStatsW(datas.rate)
d1.ttest_mean(0.11)

兩樣本檢驗【二分類變量和連續變量之間的關係
camp0 = camp[camp['Suc_flag']==0]['AvgARPU']
camp1 = camp[camp['Suc_flag']==1]['AvgARPU']
stats.stats.ttest_ind(camp0,camp1)

方差分析【多分類變量和連續變量之間的關係
import statsmodels.api as sm
from statsmodels.formula.api import  ols
sm.stats.anova_lm(ols('ARPU ~ C(Class)',data=camp).fit())#方差分析

卡方檢驗【兩個分類變量之間的關係
cross_table = pd.crosstab(camp.Class, camp.Suc_flag)
cross_table_rowpct = cross_table.div(cross_table.sum(1),axis = 0)
print('chisq = %6.4f\n p-value = %6.4f\n dof = %i\n expected_freq = %s'\
      %stats.chi2_contingency(cross_table))

置信區間估計方法
def confint(x, alpha=0.05):
    n = len(x)
    xb = x.mean()
    df = n-1
    tmp = (x.std() / n ** 0.5) * stats.t.ppf(1-alpha/2, df)
    return {'Mean': xb, 'Degree of Freedom':df, 'LB':xb-tmp, 'UB':xb+tmp}

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章