tableone比較兩組數據時各個組的均值方差均相同

今天用table比較兩個組的差異,數據是用兩個dataframe豎向拼接起來的。

然後用table進行檢驗:

columns = ['diff', 'label']
categorical = []
nonnormal = []
groupby = 'label'
mytable = TableOne(val_stats, columns, categorical, groupby, nonnormal, pval=True)
print(mytable)

發現兩個組裏的均值和方差都完全相同:

               Grouped by label                                                   
                         isnull     ai_diff    doc_diff    pval              ptest
variable level                                                                    
n                                      2569        2569                           
diff                          0  -0.2 (1.5)  -0.2 (1.5)  <0.001  Two Sample T-test

原因是由於拼接起來後沒有重新reset_index(),兩個組都引用了同一個組的數據。

reset_index()後,問題解決。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章