1. read_excel
read_excel方法定義:
pandas.read_excel(io, sheet_name=0, header=0, skiprows=None,
skip_footer=0, index_col=None, names=None, usecols=None,
parse_dates=False, date_parser=None, na_values=None,
thousands=None, convert_float=True, converters=None,
dtype=None, true_values=None, false_values=None,
engine=None, squeeze=False, **kwds)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
io: 字符串,路徑對象(pathlib.Path或py._path.local.LocalPath)
文件類對象 ,pandas Excel 文件或 xlrd 工作簿。該字符串可能是一個URL。URL包括http,ftp,s3和文件。例如,本地文件可寫成file://localhost/path/to/workbook.xlsx
sheet_name :字符串,int,字符串/整數的混合列表或None,默認爲0
表名用字符串表示,索引表位置用整數表示;字符串/整數列表用於請求多個表;沒有設置時將會自動獲取所有表;
可行的調用方式:
Defaults : 第一頁作爲數據文件
1 :第二頁作爲數據文件
“Sheet1” :第一頁作爲數據文件
[0,1,“SEET5”] :第一、第二和第五作爲作爲數據文件
None :所有表爲作爲數據文件
sheetname : 字符串,int,字符串/整數的混合列表或None,默認爲0
從版本 0.21.0:以後用 sheet_name 代替
header : 整型,或者整型列表,默認爲0
行(0-索引)用於解析的DataFrame的列標籤。如果一個整數列表被傳遞,那麼這些行位置將被合併成一個多索引。如果沒有標題,請使用None。
skiprows :類列表
開始時跳過的行(0索引)
skip_footer : 整型, 默認爲 0
結束時的行(0-索引)
index_col : 整型, 整型列表, 默認 None
列(0索引)用作DataFrame的行標籤。 如果沒有這樣的列,則傳遞無。 如果傳遞一個列表,這些列將被組合成一個MultiIndex。 如果使用usecols選擇數據子集,則index_col基於該子集。
names : 類似數組,默認無
要使用的列名列表。如果文件沒有標題行,那麼您應該顯式地通過header=None。
converters : 字典 , 默認 None
在某些列中轉換值的函數的命令。鍵可以是整數或列標籤,值是接受一個輸入參數的函數,Excel單元格內容,並返回轉換後的內容。
dtype : 類型名稱或dict的列-》其他類型,默認None
數據或列的數據類型。 例如。 {‘a’:np.float64,’b’:np.int32}使用對象保存Excel中存儲的數據,而不解釋dtype。 如果指定了轉換器,則將應用INSTEAD進行dtype轉換。
true_values : 列表, 默認 None
值視爲Ture
0.19.0版中的新功能。
false_values : 列表, 默認 None
值視爲False
0.19.0版中的新功能。
parse_cols : 整型或者列表, 默認爲 None
自0.21.0版後不推薦使用:改爲使用usecols。
usecols : 整型或者列表, 默認爲 None
- 如果爲None,則解析所有列,
- 如果爲int,則某列將被解析
- 如果爲ints,則列表要解析的列號列表將使用
- 如果爲字符串表示逗號分隔的Excel列字母和列範圍列表(例如“A:E”或“A,C,E:F”)。 範圍包括邊界兩個。
squeeze : 布爾, 默認爲 False
如果解析的數據只包含一列,則返回一個Series
na_values : 標量,字符串,列表類,或字典,默認None
某些字符串可以識別爲 NA / NaN。 默認情況下,以下值將被解釋爲NaN:
”,’#N / A’,’#N / AN / A’,’#NA’,’-1.#IND’,’1.#QNAN’, ‘-NNN’,
‘-nan’,’1.#IND’,’1.#QNAN’,’N/A’,’NA’,’NULL’,’NaN’,’n / a’,’nan ‘, ‘null’ 。
thousands : 字符串, 默認爲 None
將字符串列解析爲數字的數千個分隔符。請注意,此參數僅是在Excel中作爲文本存儲的列所必需的,無論顯示格式如何,任何數字列都將自動解析。
keep_default_na : 布爾, 默認爲True
如果指定了na_values,並且keep_default_na爲False,那麼默認的NaN值將被重寫
verbose :布爾, 默認爲 False
顯示列表中除去數字列,NA值的數量
engine: 字符串, 默認爲 None
如果io不是緩衝區或路徑,則必須將其設置爲標識io。 可接受的值是None或xlrd
convert_float : 布爾, 默認爲 True
將積分浮點數轉換爲int(即1.0 - > 1)。 如果爲False,則所有數字數據都將作爲浮點數讀取:Excel將所有數字作爲浮點數在內部存儲
2. to_excel
to_excel方法定義:
DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='',
float_format=None, columns=None, header=True, index=True,
index_label=None, startrow=0, startcol=0, engine=None,
merge_cells=True, encoding=None, inf_rep='inf', verbose=True,
freeze_panes=None)
- 1
- 2
- 3
- 4
- 5
excel_writer : 字符串或ExcelWriter 對象
文件路徑或現有的ExcelWriter
sheet_name :字符串,默認“Sheet1”
將包含DataFrame的表的名稱。
na_rep : 字符串,默認‘ ’
缺失數據表示方式
float_format : 字符串,默認None
格式化浮點數的字符串
columns : 序列,可選
要編寫的列
header : 布爾或字符串列表,默認爲Ture。
寫出列名。如果給定字符串列表,則假定它是列名稱的別名。
index :布爾,默認的Ture
寫行名(索引)
index_label : 字符串或序列,默認爲None。
如果需要,可以使用索引列的列標籤。如果沒有給出,標題和索引爲true,則使用索引名稱。如果數據文件使用多索引,則需使用序列。
startrow :
左上角的單元格行來轉儲數據框
startcol :
左上角的單元格列轉儲數據幀
engine : 字符串,默認沒有
使用寫引擎 - 您也可以通過選項io.excel.xlsx.writer,io.excel.xls.writer和io.excel.xlsm.writer進行設置。
merge_cells : 布爾,默認爲Ture
編碼生成的excel文件。 只有xlwt需要,其他編寫者本地支持unicode。
inf_rep : 字符串,默認“正”
無窮大的表示(在Excel中不存在無窮大的本地表示)
freeze_panes : 整數的元組(長度2),默認爲None。
指定要凍結的基於1的最底部行和最右邊的列