python第一個爬蟲程序

原創

2018-11-28 15:50

轉載https://www.cnblogs.com/Axi8/p/5757270.html

把python2的部分改成python3了，爬取百度貼吧某帖子內的圖片。

    #coding:utf-8
    import urllib.request#python3
    import re
    
    def get_html(url):
        page = urllib.request.urlopen(url)#打開網頁
        html = page.read()#讀取頁面源碼
        #html = html.decode(encoding='UTF-8')#python3
        html=html.decode('utf-8')#python3
        return html
        
    
    reg = r'src="(.+?\.jpg)" width'#正則表達式
    reg_img = re.compile(reg)#編譯一下，運行更快
    imglist = reg_img.findall(get_html('http://tieba.baidu.com/p/1753935195'))#進行匹配
    x = 0
    for img in imglist:
        urllib.request.urlretrieve(img,'%s.jpg'% x)
        x += 1

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

華爲雲發佈CodeArts IDE for Python，極致優雅雲原生開發體驗

近日，華爲雲正式發佈CodeArts IDE for Python，這是一款內置華爲自主創新的Python語言服務，提供智能編程、靈活調試能力的可擴展桌面開發工具，爲華爲雲開發者提供卓越Python編碼體驗。 Python 作爲一種編程語言

中間件小哥

2024-05-11 14:25:35

C#實現多線程的幾種方式

前言多線程是C#中一個重要的概念，多線程指的是在同一進程中同時運行多個線程的機制。多線程適用於需要提高系統併發性、吞吐量和響應速度的場景，可以充分利用多核處理器和系統資源，提高應用程序的性能和效率。多線程常用場景 CPU 密集型任務

2024-05-11 14:25:34

RustDesk 自建服務器部署和使用教程

RustDesk 是一個強大的開源遠程桌面軟件，是中國開發者的作品，它使用 Rust 編程語言構建，提供安全、高效、跨平臺的遠程訪問體驗。可以說是目前全球最火的開源遠程桌面軟件了，GitHub 星星數量達到了驚人的 64k！與 Team

米開朗基楊

2024-05-11 14:25:04

第二節：計數服務架構設計與落地

2024-05-11 14:25:04

公司空降一個 CTO：禁止在項目中使用 Date 類，發現立即走人！！！

作者：sum墨來源：https://www.cnblogs.com/wlovet/p/18058514 爲什麼現在連Date類都不建議使用了？一、有什麼問題嗎java.util.Date？ java.util.Date（Date從現在

2024-05-11 14:24:54

紋理是怎樣顯示在模型上的

看完games101的第8和9章，就會很好理解這些內容。三維世界中的模型是由點組成三角形，進而組成複雜的模型。每個面都有不同的顏色(像素)，可以用紋理來貼上去，最後在形成在屏幕上。立方體例子如何把2d的圖片包到3d的模型上面？把3d

2024-05-11 14:24:04

《最新出爐》系列入門篇-Python+Playwright自動化測試-46-鼠標滾輪操作

1.簡介有些網站爲了節省流量和資源，提高加載效率，採用的是動態加載（懶加載）的，也就是當拖動頁面右側滾動條後會自動加載網頁下面的內容，不拖動就不會加載的或者通過鼠標滾輪操作。 2.wheel模擬鼠標滾動 wheel模擬鼠標滾動，就是通過調

2024-05-11 14:18:03

keycloak~登錄皮膚動態切換的嘗試

keycloak的登錄皮膚theme，可以設置領域全局的，或者每個客戶端進行單獨設置，這種設計是沒有問題的，但有時，一個客戶端可能有多種主題，這時，你只能再加個客戶端，對應新的主題，但這樣不方便日後的統計，因爲很多統計維度都是以client

2024-05-11 14:16:03

lua~IDEA中調試lua腳本

開發工具 IDE工具：jetbrain IDEA 工具插件：EmmyLua 本機lua項目和調試lua文件添加lua項目模板，安裝完EmmyLua插件就有了添加模板項目後，在項目中添加lua類型的文件爲lua項目添

2024-05-11 14:16:03

lua~基本語法

學習 Lua 的必要性 nginx開發 apisix,kong插件開發語言特點語句結束沒有分號跟 JavaScript 很像默認定義的是全局變量，定義局部變量需要加 local 關鍵字數組索引從1開始沒有 i++ 操作符號

2024-05-11 14:16:03

vs2022編譯.netframework4.0工程

從其他機器拷貝一個複製到下面的目錄 C:\Program Files (x86)\Reference Assemblies\Microsoft\Framework\.NETFramework

大俠的哥哥是菜鳥

2024-05-11 14:15:53

sql高級語法

一、mysql 1、on DUPLICATE key update on DUPLICATE key update completed_value=values(completed_value)：這是 MySQL 中的 INSERT ..

2024-05-11 14:15:33

ASP.NET 8 使用 NLog

NLog:https://github.com/NLog/NLog詳細使用可以看官方Wiki：https://github.com/NLog/NLog/wiki首先 Nuget：Install-Package NLog Install-Pa

2024-05-11 14:11:32

sql語句優化的30種方法【轉】

1.對查詢進行優化，應儘量避免全表掃描，首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中使用!=或<>操作符，否則將引擎放棄使用索引而進行全表掃描。 3.應儘量避免在 where 子

2024-05-11 14:08:32

Kingbase+sqlsugar 攜手助力醫療國產化替換【人大金倉 .NET ORM】

1. 案例成某三甲醫預約系統，該項目在2024年初進行上線測試，在正常運行了兩天後，業務系統報錯：The connection pool has been exhausted, either raise MaxPoolSize

2024-05-11 14:07:02

24小時熱門文章

最新文章

最新評論文章