10 ，盒圖( 統計 ) boxplot ：單盒，多盒

原創

孙砚秋

2020-07-07 08:25

1 ，盒圖，意義：中位數

將數據排序：從小到大排序
取到 3 個值： 1/4 處，2/4 處，3/4 處
1/2 處：實際上就是中位數
中位數：
1 ，不是：數據最大值的一半
2 ，而是：排名中間的那個位置的數據
3 ，本質：是排名，不是數據

2 ，盒圖，單盒： boxplot

目的：泰坦尼克號，年齡統計
代碼：

if __name__ == '__main__':
    # 查看所有參數 ：
    # print(plt.rcParams.keys())
    # 通用設置 plt : 中文，正負號，寬度，顏色，樣式
    plt.rcParams['font.sans-serif'] = ['SimHei']
    plt.rcParams['axes.unicode_minus'] = False
    plt.rcParams['lines.linewidth'] = 2
    plt.rcParams['lines.color'] = "red"
    plt.rcParams['lines.linestyle'] = "-"

    # 數據 ：
    data = pd.read_csv("titanic_train.csv")
    data = data["Age"].dropna()
    # 盒圖 ：
    plt.boxplot(data,labels=["年齡01"])
    plt.xlabel("年齡盒圖")

    # 全顯示 ：
    plt.tight_layout()
    plt.show()

結果：

3 ，盒圖，多盒：

目的：不同倉位等級的平均年齡
代碼：

if __name__ == '__main__':
    # 查看所有參數 ：
    # print(plt.rcParams.keys())
    # 通用設置 plt : 中文，正負號，寬度，顏色，樣式
    plt.rcParams['font.sans-serif'] = ['SimHei']
    plt.rcParams['axes.unicode_minus'] = False
    plt.rcParams['lines.linewidth'] = 2
    plt.rcParams['lines.color'] = "red"
    plt.rcParams['lines.linestyle'] = "-"

    # 數據 ： 714 條，186 + 173 + 355 = 174
    data = pd.read_csv("titanic_train.csv")
    data = data[["Pclass","Age"]].dropna()

    data01 = data[data["Pclass"]==1]["Age"]
    data02 = data[data["Pclass"]==2]["Age"]
    data03 = data[data["Pclass"]==3]["Age"]

    data_new = pd.DataFrame(columns=["Age01","Age02","Age03"])
    # data_new = pd.Series(data_new)
    data01 = data01.reset_index()["Age"]
    data02 = data02.reset_index()["Age"]
    data03 = data03.reset_index()["Age"]
    # 構造新的數據
    data_new["Age01"] = data01
    data_new["Age02"] = data02
    data_new["Age03"] = data03
    # 空值處理：填寫均值
    #   38.233440860215055
    #   29.87763005780347
    #   25.14061971830986
    data_new["Age01"] = data_new["Age01"].fillna(data_new["Age01"].mean())
    data_new["Age02"] = data_new["Age02"].fillna(data_new["Age02"].mean())
    data_new["Age03"] = data_new["Age03"].fillna(data_new["Age03"].mean())
    print(data_new)

    # 畫圖 ： 盒圖
    plt.boxplot(data_new.values,labels=["一等艙","二等艙","三等艙"])
    plt.xlabel("年齡盒圖")

    # 全顯示 ：
    plt.tight_layout()
    plt.show()

結果：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

10 ，盒圖( 統計 ) boxplot ：單盒，多盒

1 ，盒圖，意義：中位數

2 ，盒圖，單盒： boxplot

3 ，盒圖，多盒：

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

HTML 00 Tutorial

全面系統的AI學習路徑，幫助普通人也能玩轉AI

從零開始：使用 Playwright 腳本錄製實現自動化測試

uni-app實現上拉加載

13 ，np 常用函數：範圍內取 n 個值

01 ，seaborn 基本設置：5種風格，刻度線，圖位置，子圖風格，文字大小，線寬

04 ，plt 設置：x-y 範圍，座標點，外邊框，plt 與 ax 的區別，推薦 ax ：

08 ，散點圖( x-y ) scatter ：

05 ，子圖：多個 ax 進行畫圖，fig.add_subplot

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

10 ，盒圖( 統計 ) boxplot ：單盒，多盒

1 ，盒圖，意義 ： 中位數

2 ，盒圖，單盒 ： boxplot

3 ，盒圖，多盒 ：

1 ，盒圖，意義：中位數

2 ，盒圖，單盒： boxplot

3 ，盒圖，多盒：