python易誤點——字符串和編碼

  • 起初計算機的編碼方式只有ascll碼一種(因爲是美國人最先發明的),但是ascll只有128個字符,其他字符比如漢字無法用ascll表示,所以我國發明瞭GB2312編碼,自然德國日本啊發明了自己國家的編碼方式,爲了將各種編碼方式統一,形成了unicode編碼
  • 但是unicode一般存儲一個字符要2字節,ascll要一個就夠了,如果都是英文的話,相當於白浪費了一倍空間。於是,形成了“可變長編碼”的UTF-8編碼。UTF-8編碼把一個Unicode字符根據不同的數字大小編碼成1-6個字節,常用的英文字母被編碼成1個字節,漢字通常是3個字節,只有很生僻的字符纔會被編碼成4-6個字節。如果你要傳輸的文本包含大量英文字符,用UTF-8編碼就能節省空間。於是一般在數據存儲的時候用unincode,傳輸的時候用utf-8
  • python的輸出格式化有兩種方式利用%和format()
  • %: ‘Hi, %s, you have $%d.’ % (‘Michael’, 1000000)
    ‘Hi, Michael, you have $1000000.’
    %d 整數
    %f 浮點數
    %s 字符串
    %x 十六進制整數
    格式爲‘xxxxx%dx%sxx%fxxxx’ % (xxx,xxx,xxx)
    如果想輸出%則用%%轉義
  • format():‘Hello, {0}, 成績提升了 {1:.1f}%’.format(‘小明’, 17.125)
    ‘Hello, 小明, 成績提升了 17.1%’
    format().format()前用{}表示佔位,後format()裏面對應順序填入參數
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章