目錄
1.CSV與TSV
C:逗號分隔的結構化文件
T:製表符分隔的文件
關於CSV已經形成了一種慣性認識:只要是普通的文本文件,並且是結構化的
所以不管是什麼分隔符,都是CSV格式
狹義上,必須是逗號
但是現在一般都把結構化的普通文本文件,用CSV的方式來對待,區別僅僅是改一下分隔符而已
2.read_csv()
參數:
- sep或delimiter指定分隔符,默認是逗號。
- header=None指定不把第一行記錄當作列名。
- names定義列名,如果指定了header=None,不指定names,則默認列名是0,1,2…
- index_col把某列當作行索引,例如數據表中的主鍵。
- usecols在讀取文件的時候只選擇讀取部分列。
導入數據:
2.1 header
2.2 names
或者在數據讀取之後,使用columns指定列標題
2.3 index_col
2.3 usecol
3.to_csv()
參數:
- sep:指定分隔符,默認是逗號。
- header:是否寫入標題行,默認True,寫入。
- na_rep:空值如何表示,默認是’’。
- index:是否寫入行索引,默認True,寫入。
- index_label:行索引的名稱,默認是None。
- columns:寫入哪些列,默認全部列。
導入數據:
3.1 sep
3.2 header
默認寫入列名,設置爲False爲不寫入。
3.3 na_rep
空值使用了"空"字替代
3.4 index
默認寫入行索引,設置爲false不寫入
3.5 index_label
默認沒有行索引名稱,如果設置header = False,則定義了行索引名稱也不會顯示,因爲header = False是不寫入標題。
3.6 columns
寫入哪些列,默認所有列都寫入。