因爲本人用的是五筆輸入法,所以時常有些自己的創建的詞,所以分了幾個txt分類記錄這些新創詞。還寫了個.bat copy *.txt aaaa.txt
,這運行的還可以。
剛剛腦袋一熱,文件名可以用中文的啊,所以將bat改成了 copy *.txt 你我他.txt
。這就不行了,文件名“你我他”會變成亂碼。因爲我是用Notepad++編輯的,默認的字符集是UTF-8,這行不能,然後我又試了UCS-2、GB2312也不行,說明cmd是不支持UNICODE的。
最後我試了ANSI,成功了。剛剛通過那鏈接知道,原來於簡體中文編碼GB2312是ANSI的一個代碼頁936。
又複習了一遍字符集,我的理解是
{
字符集:
{
字符庫,
字符碼
},
字符編碼
}
即
- 字符集由指定字符的字符碼組成(ANSI和UNICODE)
- 字符編碼是對字符碼的二次包裝(來增加兼容性,UTF-8,UTF-16等)