pd.read_excel()/pd.to_excel()參數詳解

1. read_excel

read_excel方法定義:

pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, 
skip_footer=0, index_col=None, names=None, usecols=None, 
parse_dates=False, date_parser=None, na_values=None, 
thousands=None, convert_float=True, converters=None, 
dtype=None, true_values=None, false_values=None, 
engine=None, squeeze=False, **kwds)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

io: 字符串,路徑對象(pathlib.Path或py._path.local.LocalPath)

文件類對象 ,pandas Excel 文件或 xlrd 工作簿。該字符串可能是一個URL。URL包括http,ftp,s3和文件。例如,本地文件可寫成file://localhost/path/to/workbook.xlsx

sheet_name :字符串,int,字符串/整數的混合列表或None,默認爲0

表名用字符串表示,索引表位置用整數表示;字符串/整數列表用於請求多個表;沒有設置時將會自動獲取所有表;
可行的調用方式:
Defaults : 第一頁作爲數據文件
1 :第二頁作爲數據文件
“Sheet1” :第一頁作爲數據文件
[0,1,“SEET5”] :第一、第二和第五作爲作爲數據文件
None :所有表爲作爲數據文件

sheetname : 字符串,int,字符串/整數的混合列表或None,默認爲0

從版本 0.21.0:以後用 sheet_name 代替

header : 整型,或者整型列表,默認爲0

行(0-索引)用於解析的DataFrame的列標籤。如果一個整數列表被傳遞,那麼這些行位置將被合併成一個多索引。如果沒有標題,請使用None。

skiprows :類列表

開始時跳過的行(0索引)

skip_footer : 整型, 默認爲 0

結束時的行(0-索引)

index_col : 整型, 整型列表, 默認 None

列(0索引)用作DataFrame的行標籤。 如果沒有這樣的列,則傳遞無。 如果傳遞一個列表,這些列將被組合成一個MultiIndex。 如果使用usecols選擇數據子集,則index_col基於該子集。

names : 類似數組,默認無

要使用的列名列表。如果文件沒有標題行,那麼您應該顯式地通過header=None。

converters : 字典 , 默認 None

在某些列中轉換值的函數的命令。鍵可以是整數或列標籤,值是接受一個輸入參數的函數,Excel單元格內容,並返回轉換後的內容。

dtype : 類型名稱或dict的列-》其他類型,默認None

數據或列的數據類型。 例如。 {‘a’:np.float64,’b’:np.int32}使用對象保存Excel中存儲的數據,而不解釋dtype。 如果指定了轉換器,則將應用INSTEAD進行dtype轉換。

true_values : 列表, 默認 None

值視爲Ture
0.19.0版中的新功能。

false_values : 列表, 默認 None

值視爲False
0.19.0版中的新功能。

parse_cols : 整型或者列表, 默認爲 None

自0.21.0版後不推薦使用:改爲使用usecols。

usecols : 整型或者列表, 默認爲 None

  • 如果爲None,則解析所有列,
  • 如果爲int,則某列將被解析
  • 如果爲ints,則列表要解析的列號列表將使用
  • 如果爲字符串表示逗號分隔的Excel列字母和列範圍列表(例如“A:E”或“A,C,E:F”)。 範圍包括邊界兩個。

squeeze : 布爾, 默認爲 False

如果解析的數據只包含一列,則返回一個Series

某些字符串可以識別爲 NA / NaN。 默認情況下,以下值將被解釋爲NaN:
”,’#N / A’,’#N / AN / A’,’#NA’,’-1.#IND’,’1.#QNAN’, ‘-NNN’,
‘-nan’,’1.#IND’,’1.#QNAN’,’N/A’,’NA’,’NULL’,’NaN’,’n / a’,’nan ‘, ‘null’ 。

thousands : 字符串, 默認爲 None

將字符串列解析爲數字的數千個分隔符。請注意,此參數僅是在Excel中作爲文本存儲的列所必需的,無論顯示格式如何,任何數字列都將自動解析。

keep_default_na : 布爾, 默認爲True

如果指定了na_values,並且keep_default_na爲False,那麼默認的NaN值將被重寫

verbose :布爾, 默認爲 False

顯示列表中除去數字列,NA值的數量

engine: 字符串, 默認爲 None

如果io不是緩衝區或路徑,則必須將其設置爲標識io。 可接受的值是None或xlrd

convert_float : 布爾, 默認爲 True

將積分浮點數轉換爲int(即1.0 - > 1)。 如果爲False,則所有數字數據都將作爲浮點數讀取:Excel將所有數字作爲浮點數在內部存儲

2. to_excel

to_excel方法定義:

DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='',
 float_format=None, columns=None, header=True, index=True, 
 index_label=None, startrow=0, startcol=0, engine=None, 
 merge_cells=True, encoding=None, inf_rep='inf', verbose=True, 
 freeze_panes=None)
  • 1
  • 2
  • 3
  • 4
  • 5

excel_writer : 字符串或ExcelWriter 對象

文件路徑或現有的ExcelWriter

sheet_name :字符串,默認“Sheet1”

將包含DataFrame的表的名稱。

na_rep : 字符串,默認‘ ’

缺失數據表示方式

float_format : 字符串,默認None

格式化浮點數的字符串

columns : 序列,可選

要編寫的列

header : 布爾或字符串列表,默認爲Ture。

寫出列名。如果給定字符串列表,則假定它是列名稱的別名。

index :布爾,默認的Ture

寫行名(索引)

index_label : 字符串或序列,默認爲None。

如果需要,可以使用索引列的列標籤。如果沒有給出,標題和索引爲true,則使用索引名稱。如果數據文件使用多索引,則需使用序列。

startrow :

左上角的單元格行來轉儲數據框

startcol :

左上角的單元格列轉儲數據幀

engine : 字符串,默認沒有

使用寫引擎 - 您也可以通過選項io.excel.xlsx.writer,io.excel.xls.writer和io.excel.xlsm.writer進行設置。

merge_cells : 布爾,默認爲Ture

編碼生成的excel文件。 只有xlwt需要,其他編寫者本地支持unicode。

inf_rep : 字符串,默認“正”

無窮大的表示(在Excel中不存在無窮大的本地表示)

freeze_panes : 整數的元組(長度2),默認爲None。

指定要凍結的基於1的最底部行和最右邊的列

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章