Urllib 是Python自帶的標準庫，無需安裝，直接可以用。
提供瞭如下功能：

網頁請求
響應獲取
代理和cookie設置
異常處理
URL解析

爬蟲所需要的功能，基本上在urllib中都能找到，學習這個標準庫，可以更加深入的理解後面更加便利的requests庫。

先來一個最簡單的例子：

 from urllib import request

 response = urllib.request.urlopen('http://www.baidu.com')
 print(response.read().decode('utf-8'))

執行後就可以得到百度首頁的 HTML 。

response對象有一個read方法，可以返回獲取到的網頁內容。

如果不加read直接打印會直接打印出了該對象的描述

上面使用了一個 urlopen的函數，urlopen()函數用於實現對目標url的訪問。

urlopen 語法

urllib.request.urlopen(url,data=None,[timeout,]*,cafile=None,capath=None,cadefault=False,context=None)
#url:訪問的網址

#data:額外的數據，如header，form data

從上一篇文章可以看到數據傳送主要分爲POST和GET兩種方式。那這兩種方式有什麼區別呢？

最重要的區別：

GET方式直接以鏈接形式訪問，鏈接中包含了所有的參數，若包含了密碼的話是不安全的，不過你可以直觀地看到自己提交了什麼內容。POST則不會在網址上顯示所有的參數，不過如果你想直接查看提交了什麼就不太方便了。

POST方式：

先演示一下吧：

 import urllib.parse
 import urllib.request

 values = {"username":"1559186****","password":"*********"}
 data = urllib.parse.urlencode(values)
 url = "https://passport.csdn.net/account/login"
 response = urllib.request.urlopen(url,data)
 print(response.read())

urlencode是一個函數，可將字符串以URL編碼，用於編碼處理。

可以看到核心的代碼是 response = urllib.request.urlopen(url,data)

這裏用到了data參數（或者說POST方式用到了data參數）。例子上的data參數中的內容十分簡單、所以並不能真正的登錄。

GET方式：

同樣的，先舉個例子：

 import urllib.parse
 import urllib.request

 values = {"username":"15591861964","password":"yanhang1235813"}
 data = urllib.parse.urlencode(values)
 url = "https://passport.csdn.net/account/login"
 geturl = url + "?"+data
 response = urllib.request.urlopen(geturl)
 print(response.read())

可以看到這次的核心代碼是這樣的：response = urllib.request.urlopen(geturl)

沒有了data參數、只是url參數。而URL參數的內容是原來的url加？然後加編碼後的參數。

從上面的POST和GET兩種不同方式的例子就驗證了一個結論，

GET方式直接以鏈接形式訪問，鏈接中包含了所有的參數

POST則不會在網址上顯示所有的參數

下面是擴展學習的一些東西（Urllib庫的其他內容)

timeout參數的使用

開始練習的時候我是對 http://httpbin.org/post 這個網站發的請求，但是遲遲沒有響應、、、

最終返回了報錯信息
urllib.error.HTTPError: HTTP Error 503: Service Unavailable

那如果給請求設置一個超時時間應該會好一點，urlopen有一個timeout參數

 from urllib import request

 response = request.urlopen('http://httpbin.org/get', timeout=0.1)
 print(response.read())

這次的錯誤返回信息是：

urllib.error.URLError: <urlopen error timed out>

也可以將這個作爲異常、捕獲處理

import socket
import urllib.request
import urllib.error

try:
    response = urllib.request.urlopen('http://httpbin.org/get', timeout=0.1)
except urllib.error.URLError as e:
    if isinstance(e.reason, socket.timeout):
        print('TIME OUT')

作者：Ghost9
來源：CSDN
原文：https://blog.csdn.net/Ghost9/article/details/80255039

python爬蟲從入門到放棄（三）- Urllib庫的基本使用方法1

urlopen 語法

POST方式：

GET方式：

timeout參數的使用

python爬蟲從入門到放棄（三）- Urllib庫的基本使用方法1

python爬蟲從入門到放棄（二）- 爬蟲的深層原理

python爬蟲從入門到放棄（一）- 認識爬蟲

python爬蟲從入門到放棄（三）- Urllib庫的基本使用方法1

python爬蟲從入門到放棄（二）- 爬蟲的深層原理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結