python3 下 url解碼

在url中出現中文字符時候,一般都是編碼爲utf-8格式的百分號編碼的,但是也有部分網站encode成gbk編碼格式。

  1. utf-8格式: 1箇中文字符編碼爲3個字節的百分號編碼格式;(python3 urllib.parse 默認編碼是utf-8)
  2. gbk格式: 1箇中文字符編碼爲2個字節的百分號編碼格式。
from urllib.parse import unquote,quote

name = '國'
gbk_name = quote(name,encoding = 'gbk')
print(gbk_name)
print(unquote(gbk_name, encoding='gbk'))

utf_name = quote(name)
print(utf_name)
print(unquote(utf_name))
E:/track_code/test.py
>>>%B9%FA
>>>國
>>>%E5%9B%BD
>>>國
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章