merge&join&concat
注意:
pandas的merge和數據庫中join原理類似
- 在數據是dataframe的時候,join底層調用的是merge,
- concat方法相當於數據庫中的全連接(UNION ALL),可以指定按某個軸進行連接,也可以指定連接的方式join(outer,inner 只有這兩種),與數據庫不同的是concat不會去重,要達到去重的效果可以使用drop_duplicates方法
pandas 讀入文件亂碼問題
解決pandas讀入csv中文亂碼問題(encoding各種編碼都出錯):
- data=open(r’filename’),df=pd.DataFrame(data);如失效採用
- 2.右鍵複製數據入subline,然後設置編碼方式爲 utf-8,save文件,然後用pd讀入即可