python pd.read_csv()函數

csv格式說明:
CSV文件是一個純文本文件,最早用在簡單的數據庫裏,其格式簡單,具備很強的開放性,非常容易被導入各種PC表格及數據庫,比如Excel表格等。

CSV文件中每行相當於一條記錄(相當於數據表中的一行),用 “,”(半角逗號)分割每行的不同字段。舉例如下:

   例:

                  1, 23, 32,12

                  2, 44, 12, 56

對應Excel表格,CSV文件中的一行對應Excel的一行,CSV同一行中的半角逗號相當於Excel表格同一行分割不同單元格的豎線。

官方文檔:

read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]], sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression='infer', thousands=None, decimal: str = '.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

主要參數說明:

1.filepath_or_buffer:讀取文件的路徑。
2.sep : 指定分隔符。如果不指定參數,則會嘗試使用逗號分隔。
sep=,# 以,爲數據分隔符
3.delimiter :定界符,備選分隔符(如果指定該參數,則sep參數失效)
4.dtype :每列數據的數據類型。
5.skiprows :需要忽略的行數(從文件開始處算起),或需要跳過的行號列表(從0開始)。
shkiprows= 10 # 跳過前十行
6.nrows : 需要讀取的行數(從文件頭開始算起)。
nrows = 10 # 只去前10行

示例:

filename='data/xxx'
name=['separ-length','separ-width','petal-length','petal-width','class']
dataset=pd.read_csv(filename,names=name)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章