爬蟲流程:
①先由urllib的request打開Url得到網頁html文檔
②瀏覽器打開網頁源代碼分析元素節點
③通過Beautiful Soup或則正則表達式提取想要的數據
④存儲數據到本地磁盤或數據庫(抓取,分析,存儲)
try:password——>text
div,dd,等都是類似於包的存在
class = “” 是屬性
xx.find_all(‘xx’,id=’’,class_=’’)
xx.content
chunk下載
其他後補。。
爬蟲流程:
①先由urllib的request打開Url得到網頁html文檔
②瀏覽器打開網頁源代碼分析元素節點
③通過Beautiful Soup或則正則表達式提取想要的數據
④存儲數據到本地磁盤或數據庫(抓取,分析,存儲)
try:password——>text
div,dd,等都是類似於包的存在
class = “” 是屬性
xx.find_all(‘xx’,id=’’,class_=’’)
xx.content
chunk下載
其他後補。。
1.while循環的格式 while 條件: 條件滿足時,做的事情1 條件滿足時,做的事情2 條件滿足時,做的事情3 ...(省略)... demo