BI神器Power Query(8)-- PQ從文本文件導入數據(2/2)

文本文件是大家經常使用的數據文件格式,PQ可以方便的導入文本文件中的數據,然後在Excel可以進行後續加工和處理。

依次單擊【數據】選項卡>【新建查詢】>【從文件】,其中的【從CSV】和【從文本】兩個命令都可以用於導入文本數據。

大家在工作中使用的文本數據文件,並不侷限於Excel導出的文件,其格式可能會有與上一篇博客(BI神器Power Query(7)-- PQ從文本文件導入數據(1/2))所講解的文件不同。

例如某銀行網銀導出的交易記錄文件,如下圖所示。

值得注意的是:

  • 文件第1~7行不是表格數據,導入是需要刪除
  • 粗略看數據部分是逗號間隔的文本文件
  • 每個數據被半角雙引號包裹
  • 部分字段數據中有多餘的空格,“交易日期”字段有前導空格,需要確認PQ是否可以剔除這些空格

數據導入

下面就嘗試用PQ導入這個文本文件,【從CSV】和【從文本】結果都是一樣的,如下圖所示,PQ導入數據出現亂碼,由上圖可知此文本文件編碼格式爲UTF-8,但是PQ識別爲GB2312。

修改文件原始格式爲UTF-8,文件內容可以正常顯示,但是由於文件前7行的干擾,PQ無法直接識別表格數據,此時需要單擊【編輯】按鈕在PQ編輯器中進行數據清洗。


數據清洗

  • 依次單擊【刪除行】>【刪除排在前面的行】,輸入【行數】爲7,單擊【確定】按鈕。

  • 依次單擊【拆分列】>【按分隔符】,逗號作爲分隔符,選中【在出現的每個分隔符處】,單擊【確定】按鈕,完成拆分列。

  • 單擊【將第一行用作標題】提升標題行。注意:操作步驟中需要先拆分列,再提升標題,否者無法正確拆分列。

清洗完畢的數據如下圖所示,“交易日期”字段有前導空格已經被剔除。。

  • 關閉並上傳至工作表中如下圖所示。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章