chardet編碼識別

import chardet

a = chardet.detect(response.body)
        for key, value in a.items():
            if key == 'encoding':
                print(value)

這樣得到的結果就是字符編碼了,需要注意的是我們指定要識別的html一定要是字節流格式,這裏用的scrapy默認方法response.body默認格式字節流

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章