Python學習備忘筆記——關於計算機字符串編碼的問題

爲什麼要寫這部分筆記呢?因爲生活在大中華地區,編程過程中鐵定會遇上’中文’字符串,而存儲跟傳輸中文字符串之前是需要對其進行編碼的,這就涉及到字符串編碼的問題了。而這篇博客記錄的不是對編碼問題的討論,而是對編碼問題的幾點備忘知識點~~說白了就是給我這個編程小白備忘的!!

1)在計算機中8個比特(bit)作爲一個字節byte,1個byte能表示的最大整數位255;
2)英文字母需用1個byte,用ASCII編碼;
3)中文字符正常情況下是3個bytes,生僻字6個bytes,用Unicode編碼;本着節約的精神,當需要保存到硬盤或需要傳輸時就轉爲可變長短編碼的UTF-8編碼;
4)瀏覽網頁時,服務器會把動態生成的Unicode內容轉換爲UTF-8再傳輸到瀏覽器;

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章