python爬蟲中unescape 將JS中escape後的字符串解碼

#編碼
escape_str = ‘北京’
str = escape_str.encode(‘unicode_escape’).decode(‘utf-8’)
str1 = str.replace(’\u’,’%u’)# 得到結果 str1 = ‘%u5317%u4eac’
print(str1)

#同理解碼
import urllib.parse

escape_str = ‘%u4eba%u751f%u82e6%u77ed’
str1 = escape_str.replace(’%u’, ‘\u’)# 得到結果 str1 = ‘\u4eba\u751f\u82e6\u77ed’
str = str1.encode(‘utf-8’).decode(‘unicode_escape’)# 得到結果str = ‘人生苦短’

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章