pd drop_duplicates返回結果count和to_csv的結果不一致

目的是從表中找出不重複的公司個數,一開始採用了drop_duplicates獲取一個去重後的表,count()後發現是500多家,神奇的是當我將結果導入csv,發現只有不到100條。然後我採用groupby的方式獲取分組結果,發現分組後的公司確實是500多家,導入csv與count的結果是一致的,這裏記錄一下,還沒有解決。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章