08 ，df 列操作：字段名，dtype 字段類型，字段操作案例，列計算，大，小，平均值

原創

2020-07-05 00:42

1 ，字段名： data.columns

代碼：

if __name__ == '__main__':
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    # 所有字段 ：
    cols = data.columns
    print(cols)
==================================
Index(['PassengerId', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp',
       'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'],
      dtype='object')

2 ，字段類型，查看： data.dtypes

代碼：

if __name__ == '__main__':
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    # 所有字段 ：
    res = data.dtypes
    print(res)
================================
PassengerId      int64
Survived         int64
Pclass           int64
Name            object
Sex             object
Age            float64
SibSp            int64
Parch            int64
Ticket          object
Fare           float64
Cabin           object
Embarked        object

3 ，字段類型，修改：data[“PassengerId”].astype(“object”)

代碼：

if __name__ == '__main__':
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    # 所有字段 ：
    print(data.dtypes)
    data["PassengerId"] = data["PassengerId"].astype("object")
    print(data.dtypes)
=======================================================
PassengerId      int64
Survived         int64
Pclass           int64
Name            object
Sex             object
Age            float64
SibSp            int64
Parch            int64
Ticket          object
Fare           float64
Cabin           object
Embarked        object
=======================================================
PassengerId     object
Survived         int64
Pclass           int64
Name            object
Sex             object
Age            float64
SibSp            int64
Parch            int64
Ticket          object
Fare           float64
Cabin           object
Embarked        object

4 ，案例：字段操作

字段名操作：
1 ，定位：找出所有以 “d” 結尾的字段，並且取出。
2 ，操作：將這些字段 * 2，得到新的字段
3 ，替換：將原字段刪除，將新字段放入
精華代碼：

# 3 ，製造新 df
new_df = data[new_cols] * 2
# 4 ，去掉舊 df
res_data = data.drop(new_cols,axis=1)
# 5 ，添加新列
res_data[["new01","new02","new03"]] = new_df

全部代碼：

import numpy as np
import pandas as pd
import pandas.core.frame

if __name__ == '__main__':
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    # 1 ，所有字段 ：
    old_cols = data.columns.tolist()
    # 2 ，找到所有的 d 結尾字段
    new_cols = []
    for e in old_cols:
        if str(e).endswith("d"):
            new_cols.append(e)
    print(old_cols)
    print(new_cols)
    # 3 ，製造新 df
    new_df = data[new_cols] * 2
    # 4 ，去掉舊 df
    res_data = data.drop(new_cols,axis=1)
    # 5 ，添加新列
    res_data[["new01","new02","new03"]] = new_df
    print(res_data)
================================================================
['PassengerId', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked']
['PassengerId', 'Survived', 'Embarked']
     Pclass                                               Name  ... new02  new03
0         3                            Braund, Mr. Owen Harris  ...     0     SS
1         1  Cumings, Mrs. John Bradley (Florence Briggs Th...  ...     2     CC
......................
......................

5 ，列計算，列乘：data[“PassengerId”] * data[“Survived”]

不同列之間：可以做計算，加減乘除
代碼：

if __name__ == '__main__':
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    # 取出兩列
    df_new = data[["PassengerId","Survived"]]
    df_tow = data["PassengerId"] * data["Survived"]
    df_new["tow"] = df_tow
    print(df_new)
===================================
     PassengerId  Survived  tow
0              1         0    0
1              2         1    2
2              3         1    3

6 ，最大值：data[“Age”].max()

代碼：年齡最大的人

if __name__ == '__main__':
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    # 取出兩列
    res = data["Age"].max()
    print(res)
=======================
80.0

7 ，最小值： data[“Age”].min()

8 ，平均值： data[“Age”].mean()

注意，這個平均值，不是：總和/總數
是：不算空值

9 ，總和： data[“Age”].sum()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

08 ，df 列操作：字段名，dtype 字段類型，字段操作案例，列計算，大，小，平均值

1 ，字段名： data.columns

2 ，字段類型，查看： data.dtypes

3 ，字段類型，修改：data[“PassengerId”].astype(“object”)

4 ，案例：字段操作

5 ，列計算，列乘：data[“PassengerId”] * data[“Survived”]

6 ，最大值：data[“Age”].max()

7 ，最小值： data[“Age”].min()

8 ，平均值： data[“Age”].mean()

9 ，總和： data[“Age”].sum()

AI 畫圖真刺激，手把手教你如何用 ComfyUI 來畫出刺激的圖

公司剛入職了一名 Java 中級開發，短短 4 行代碼居然湊齊了 3 個 bug！我哭了~~

數據展示動態（跑分）顯示

公衆號5月C#/.NET熱文一覽

git 下載大陸鏡像地址

13 ，np 常用函數：範圍內取 n 個值

01 ，seaborn 基本設置：5種風格，刻度線，圖位置，子圖風格，文字大小，線寬

04 ，plt 設置：x-y 範圍，座標點，外邊框，plt 與 ax 的區別，推薦 ax ：

08 ，散點圖( x-y ) scatter ：

05 ，子圖：多個 ax 進行畫圖，fig.add_subplot

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

08 ，df 列操作 ：字段名，dtype 字段類型，字段操作案例，列計算，大，小，平均值

1 ，字段名 ： data.columns

2 ，字段類型，查看 ： data.dtypes

3 ，字段類型，修改 ：data[“PassengerId”].astype(“object”)

4 ，案例：字段操作

5 ，列計算，列乘 ：data[“PassengerId”] * data[“Survived”]

6 ，最大值 ：data[“Age”].max()

7 ，最小值 ： data[“Age”].min()

8 ，平均值 ： data[“Age”].mean()

9 ，總和 ： data[“Age”].sum()

08 ，df 列操作：字段名，dtype 字段類型，字段操作案例，列計算，大，小，平均值

1 ，字段名： data.columns

2 ，字段類型，查看： data.dtypes

3 ，字段類型，修改：data[“PassengerId”].astype(“object”)

5 ，列計算，列乘：data[“PassengerId”] * data[“Survived”]

6 ，最大值：data[“Age”].max()

7 ，最小值： data[“Age”].min()

8 ，平均值： data[“Age”].mean()

9 ，總和： data[“Age”].sum()