最近太懶了,以後會經常更新博客,記錄每天的收穫,加油!
1、python讀取excel表格
1)導入模塊: import xlrd
2)選擇excel文件:excel = xlrd.open_workbook('test.xls')
注意:若excel文件與py文件不是同一個路徑,則需要在excel名稱前添加其絕對路徑。
3)選擇sheet表:table = excel.sheets()[0]
注意:0代表excel裏面的第一個表格,依此類推。
4)讀取表中數據:(注意:行數和列數從0算起)
讀取數據錶行數:nrows = table.nrows
讀取數據表列數:ncols = table.ncols
定義存儲數據列表:data = []
循環表格行數存儲數據:for i in range(0, table.nrows):
data.append(table.row_values(i))
5) 獲取第i行數據:
方式1:從存儲數據的列表中獲取:rowdata_i = data[i]
方式2:從table中直接讀取: rowdata_i = table.row_values(i)
方式3:見7)
方式4:見8)
6) 獲取第j列數據:
方式1:從table中直接讀取: coldata_j = table.col_values(i)
方式2:見7)
方式3:見8)
7)獲取第i行第j列數據:(注意:非數值列轉化爲矩陣時自動忽略)
導入科學計算庫: import panda as pd
將數據轉成表格型數據結構:data = pd.DataFrame(data)
獲取第i行數據: rowdata_i = data.loc[i] (位置索引)
rowdata_i = data.iloc[i] (基於標籤的索引)
獲取前i行數據:rowdata_1toi = data[: i]
獲取第j列數據:coldata_j = data[j]
獲取第i行第j列數據:data_ij = data[i][j]
8) 將數據變成數組
導入高性能科學計算和數據分析的基礎包:import numpy as np
將數據轉成數組格式:data = np.array(data)
獲取第i行數據: rowdata_i = data[i]
獲取前i行數據: rowdata_1toi = data[: i]
獲取第j列數據: coldata_j = data[:,j]
獲取第i行第j列數據:data_ij = data[i][j]