原创 python字符編碼

字符編碼 一、ascii碼: 基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言,最多隻能用8位標識,即2**8=256-1,所以最多隻能表示255個字符。 計算機沿用中國,中文顯然遠大於255字符,必須要對中文進行編碼 二

原创 獲取html資源

獲取HTML資源 主要模塊爲urllib.request 1、使用urlopen和urlretrieve獲取http資源 和open內置方法可以讀取文件一樣,urlopen可以用來讀取url資源。不同的是,urlopen不能對獲取的資源數據

原创 python3變化

一、print,在python3中已經是函數 >>> import sys >>> print("fatal error",file=sys.stderr) fatal error >>> fp=open(r"d:\\a.txt",'w')

原创 url處理

一、url處理 python3中url處理包名稱爲urllib,其中主要功能模塊如下:error模塊parse模塊request模塊response模塊robotparse模塊 1.1、url解析 舉例1: from urllib.pars