背景
處理數據代碼出了 bug ,導致以 \t 分割的數據 中第二列的空格符變成了 \t,本來數據都是 n 列,部分錯誤數據變成了 n+1 列,需要將錯誤數據恢復正常。
思路
split 分割數據( \t 作爲分隔符 ),然後格式化輸出,代碼如下:
cat 8NF_data | awk '{len=split($0,a,"\t") ;print a[1]"\t"a[2]a[3]"\t"a[4]"\t"a[5]"\t"a[6]"\t"a[7]"\t"a[8] }'
處理數據代碼出了 bug ,導致以 \t 分割的數據 中第二列的空格符變成了 \t,本來數據都是 n 列,部分錯誤數據變成了 n+1 列,需要將錯誤數據恢復正常。
split 分割數據( \t 作爲分隔符 ),然後格式化輸出,代碼如下:
cat 8NF_data | awk '{len=split($0,a,"\t") ;print a[1]"\t"a[2]a[3]"\t"a[4]"\t"a[5]"\t"a[6]"\t"a[7]"\t"a[8] }'
繼續運行 ?* 回憶上次內容 上次使用shell環境中的命令 命令 作用 c
01 綜述 Opal 是愛奇藝大數據團隊研發的機器學習平臺,包含特徵生產、樣本構建、模型訓練、模型部署在內的多環節 Bigdata + AI 開發服務,內置多種訓練鏡像、