pandas基礎問題解決與整理

merge&join&concat

注意:
pandas的merge和數據庫中join原理類似

  1. 在數據是dataframe的時候,join底層調用的是merge,
  2. concat方法相當於數據庫中的全連接(UNION ALL),可以指定按某個軸進行連接,也可以指定連接的方式join(outer,inner 只有這兩種),與數據庫不同的是concat不會去重,要達到去重的效果可以使用drop_duplicates方法

pandas 讀入文件亂碼問題

解決pandas讀入csv中文亂碼問題(encoding各種編碼都出錯):

  1. data=open(r’filename’),df=pd.DataFrame(data);如失效採用
  2. 2.右鍵複製數據入subline,然後設置編碼方式爲 utf-8,save文件,然後用pd讀入即可
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章