Python_pandas：讀取CSV文件、查找指定列和單元格、解決NaN問題

原創

2020-07-04 16:32

目錄

爲什麼不推薦用csv庫？

爲什麼推薦使用pandas讀取csv文件？

開始pandas操作csv文件之旅：

0.csv文件預覽

1.讀取csv文件

2.查找指定列及指定單元格

2.1指定列：通過索引指定列名爲hour的列

2.2指定單元格：1001A列23時的AQI值

3.解決遇到的"NAN"

爲什麼不推薦用csv庫？

本段說說使用csv庫常見的問題：

csv.DictWriter():該函數返回的結果遍歷一次之後，再次遍歷返回的結果是空列表。
csv.reader():返回的結果是結構體，需要for循環才能調用，不能像list那樣直接選取特定單元格。

通過列名來查找指定列的操作麻煩。

#選擇特定的單元格

reader = csv.reader(filenanme)
for row in reader:
    print(row[0])

以上問題如何解決：

每次循環遍歷完，重新使用csv.DictWriter()函數讀取文件。
繼續熟練使用。
轉身擁抱pandas。

爲什麼推薦使用pandas讀取csv文件？

方便，有專門支持讀取csv文件的pd.read_csv()函數。
將csv轉換成二維列表形式
支持通過列名查找特定列。
相比csv庫，事半功倍。

開始pandas操作csv文件之旅：

0.csv文件預覽

1.讀取csv文件

import pandas as pd

file="E:\data\test.csv"
csvPD=pd.read_csv(file)

2.查找指定列及指定單元格

2.1指定列：通過索引指定列名爲hour的列

通過索引找到列的方式：csvPD['hour']

在hour列中找到時間爲23的行：
for i in range(len(csvPD)):
if str(csvPD['hour'][i])=="23":
print(csvPD['hour'][i])

2.2指定單元格：1001A列23時的AQI值

keyWord="1001A"
for i in range(len(csvPD)):
if str(csvPD['hour'][i])=="23" and str(csvPD['type'][i])== "AQI":
result=csvPD[keyWord][i]
print(result)

import pandas as pd

#讀取cvs文件
file="E:\data\test.csv"
csvPD=pd.read_csv(file)

#指定列名爲hour的列
csvPD['hour']


#在hour列中找到時間爲23的行
for i in range(len(csvPD)):
    if str(csvPD['hour'][i])=="23":
        print(csvPD['hour'][i])


#在hour列中找到時間爲23時1001A站點的AQI值
keyWord="1001A"
for i in range(len(csvPD)):
    if str(csvPD['hour'][i])=="23" and str(csvPD['type'][i])== "AQI":
        result=csvPD[keyWord][i]
        print(result)

3.解決遇到的"NAN"

csv文件中：1002A站點0時的AQI爲空白值，返回的結果爲NAN

NAN全稱：Not A Number

常規解決思路：

使用numpy函數來判斷：np.isnan() 和 ~~xxx is np.nan~~
通過運算操作判斷：任何數字乘上0都是0
讀取文件時加參數：pd.read_csv(file, keep_default_na=False)

操作結果如下圖：

1.推薦使用np.isnan()，csvPD["1002A"][0] is np.nan顯示爲Flase

2.推薦使用nan*0之後仍是nan，而不是0

3.加了參數後，輸出的所有數據類型變爲str，nan變爲空值，len(result)=0。

代碼：

使用函數：

import numpy as np

result=csvPD["1002A"][0]

if np.isnan(result):
    print("該數據爲%f,不能參與計算",result)
else:
    print(result)

使用運算方式：

result=csvPD["1002A"][0]

if result*0 == 0 :
    print(result)
else:
    print("該數據爲%f,不能參與計算",result)



#若數據大於0
result=csvPD["1002A"][0]

if result > 0 :
    print(result)
else:
    print("該數據爲%f,不能參與計算",result)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

地理數據可視化的神奇組合：Python和Geopandas

本文分享自華爲雲社區《Python與Geopandas：地理數據可視化與分析指南》，作者：檸檬味擁抱。地理數據可視化在許多領域都是至關重要的，無論是研究地理空間分佈、城市規劃、環境保護還是商業決策。Python語言以其強大的數據處理和可視

2024-05-15 10:59:41

Scrapy爬蟲：利用代理服務器爬取熱門網站數據

在當今數字化時代，互聯網上充斥着大量寶貴的數據資源，而爬蟲技術作爲一種高效獲取網絡數據的方式，受到了廣泛的關注和應用。本文將介紹如何使用Scrapy爬蟲框架，結合代理服務器，實現對熱門網站數據的高效爬取，以抖音爲案例進行說明。 1. 簡

2024-05-15 00:08:57

Python函數與模塊的精髓與高級特性

本文分享自華爲雲社區《Python函數與模塊的精髓與高級特性》，作者：檸檬味擁抱。 Python 是一種功能強大的編程語言，擁有豐富的函數和模塊，使得開發者能夠輕鬆地構建複雜的應用程序。本文將介紹 Python 中函數和模塊的基本使用方法，

2024-05-14 11:00:07

利用pyinstaller打包Python程序爲一個可執行文件

有時，Python發佈的程序需要被打包爲一個文件夾、甚至一個文件發佈。目前（2020）最佳的策略是使用pyinstaller。 pyinstaller不僅支持打包整個運行環境到一個可執行文件，而且還支持加密。但唯一的問題是，必須依賴

2024-05-14 02:04:34

做開發我是認真的！要麼不做，要麼全力以赴 | 每日趣聞

戳一戳小程序查看更多！往期趣聞 ☞你拖後腿了嗎？11 月份程序員工資出爐~ | 每日趣聞 ☞計算機專業會修電腦實錘！| 每日趣聞 ☞IT 行業這麼廣，你的職業規劃是什麼？| 每日趣聞 ☞奔潰啦~希望 Python 可

2024-05-14 01:47:34

anaconda和pycharm區別是什麼?Python學習!

　　學習Python的人，肯定聽說過anaconda和pycharm，但是很多人傻傻分不清楚它們之間有什麼區別，今天小編帶大家好好了解一下。　　Anaconda：　　是一個Python發行版，包含了conda、Python等180多個

2024-05-14 01:47:30

Python爬蟲進階必備 | MD5 hash 案例解析彙總（一）

上次鹹魚對關於 MD5 hash 的JS加密方法做了總結，這次把鹹魚遇到的 MD5 hash 的案例做了彙總，這個彙總系列會持續更新，攢到一定數量的網站就發一次。關於 MD5 HASH 的處理可以參考下面這篇文章： Python爬蟲進

2024-05-14 01:40:15

爲程序員和新手準備的 8 大 Python 工具

Python 是一種開源編程語言，用於 Web 編程、數據科學、人工智能和許多科學應用。學習 Python 使程序員能夠專注於解決問題，而不是專注於語法，其豐富的庫賦予它完成偉大任務所需的力量。 1) IDLE 安裝 Python 時

2024-05-14 01:06:43

【編測編學】自動化測試面試必背（上）

1、你會封裝自動化測試框架嗎？這個問得最多，甚至有很多公司直接寫在招聘要求中。自動化框架主要的核心框架就是分層+PO模式：分別爲：基礎封裝層BasePage，PO頁面對象層，TestCase測試用例層。然後再加上日誌處理模塊，ini配置文

2024-05-14 00:41:23

樹莓派真是個讓人慾罷不能的“小妖精”

大晚上不睡覺、枸杞泡起來@我一個月之前、自從入了樹莓派4b 8g板之後、就無法自拔，上班除了開發業務代碼和搭建內部UI組件庫之外，就是不亦樂乎的學習docker、mysql、mongodb、php、python、frp等，採購了阿里雲E

2024-05-14 00:37:28

用python畫出全球疫情趨勢變化圖

前言文的文字及圖片來源於網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。作者：謙睿科技 PS：如有需要Python學習資料的小夥伴可以加點擊下方鏈接自行獲取http://t.cn/A6Z

2024-05-14 00:03:10

複雜嵌套字典數據結構處理庫-glom

經常遇到複雜嵌套字典數據，我們都是這麼寫的 data = {'a': {'b': {'c': 'd'}}} print(data['a']['b']['c']) 'd' 然後經常遇到這個bug data2 = {'a': {'b':

2024-05-13 22:58:14

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

OpenCV入門基礎操作（一）----圖像的讀取、顯示與保存

OPENCV入門基礎操作（一）圖像的處理讀入圖像顯示圖像保存圖像直接上整體代碼示例圖像的處理剛開始學習opencv 圖像處理，希望能夠多多提出寶貴意見，我也在一步一步地學習下去。堅持！這一講主要就是一

2024-05-13 21:17:21

安裝Auto-GPT

安裝 Python 3.8 或更高版本 https://phoenixnap.com/kb/how-to-install-python-3-ubuntu # 查看是否已經安裝了python python --version #更新包 sud

2024-05-12 22:43:51

24小時熱門文章

最新文章

最新評論文章