pd drop_duplicates返回结果count和to_csv的结果不一致

目的是从表中找出不重复的公司个数,一开始采用了drop_duplicates获取一个去重后的表,count()后发现是500多家,神奇的是当我将结果导入csv,发现只有不到100条。然后我采用groupby的方式获取分组结果,发现分组后的公司确实是500多家,导入csv与count的结果是一致的,这里记录一下,还没有解决。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章