目的是從表中找出不重複的公司個數,一開始採用了drop_duplicates獲取一個去重後的表,count()後發現是500多家,神奇的是當我將結果導入csv,發現只有不到100條。然後我採用groupby的方式獲取分組結果,發現分組後的公司確實是500多家,導入csv與count的結果是一致的,這裏記錄一下,還沒有解決。
pd drop_duplicates返回結果count和to_csv的結果不一致
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
網絡爬蟲的祕密:如何高效地抓取JD.com視頻鏈接
原創
2024-05-18 00:07:59
記一次有點抽象的滲透經歷
原創
2024-05-17 23:16:30
地理數據可視化的神奇組合:Python和Geopandas
原創
2024-05-15 10:59:41
Scrapy爬蟲:利用代理服務器爬取熱門網站數據
原創
2024-05-15 00:08:57
Python函數與模塊的精髓與高級特性
原創
2024-05-14 11:00:07
利用pyinstaller打包Python程序爲一個可執行文件
osc_hwc3munb
2024-05-14 02:04:34
做開發我是認真的!要麼不做,要麼全力以赴 | 每日趣聞
osc_r0irdqn7
2024-05-14 01:47:34
anaconda和pycharm區別是什麼?Python學習!
osc_r0irdqn7
2024-05-14 01:47:30
Python爬蟲進階必備 | MD5 hash 案例解析彙總(一)
osc_hzf6peqc
2024-05-14 01:40:15
爲程序員和新手準備的 8 大 Python 工具
osc_7cws6vmd
2024-05-14 01:06:43
【編測編學】自動化測試面試必背(上)
osc_pjx77r92
2024-05-14 00:41:23
樹莓派真是個讓人慾罷不能的“小妖精”
osc_51airx3z
2024-05-14 00:37:28
用python畫出全球疫情趨勢變化圖
osc_t1bxxmjp
2024-05-14 00:03:10
複雜嵌套字典數據結構處理庫-glom
osc_61miaq6u
2024-05-13 22:58:14