dataframe進階操作

1.  data增加一列

import pandas as pd
import  numpy as np

filepath = "back.csv"
#讀取文件到train,類型爲dataframe
train = pd.read_csv(filepath)
#均是列名
target = 'ptype'
IDcol = 'id'
#計算有多少行
sum = train[target].value_counts()
#創建一個值爲0的ndarray 長度爲sum
tmp =np.zeros(sum,dtype=np.int32)
#參數分別是 1縱軸索引,2新增列名,3數據data(長度要求與原列數相同)
train.insert(25,'label',tmp)
print(train)
保存文件
train.to_csv(filepath)

2.合併兩個dataframe

import  pandas as pd
import  numpy as np


df1 =pd.DataFrame(np.arange(10).reshape(2,5))
df2 =pd.DataFrame(np.arange(20).reshape(4,5))
print(df1)
print(df2)
#將df2添加到df1後邊,存入result,  ignore_index表示改變df2的行索引值設爲df1的行索引值之後
result = df1.append(df2,ignore_index=True)
print(result)

五行代碼合併兩個.csv文件

import pandas as pd

train = pd.read_csv("back.csv")
neris = pd.read_csv("neris.csv")
result = train.append(neris,ignore_index=True)
result.to_csv("backaneris.csv")

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章