自学Python 3网络爬虫（一）

原創

星空下的那个人影

2018-08-28 12:26

urllib提供了一系列用于操作URL的功能。

import urllib.request
url = "http://www.baidu.com"
#data返回类型：<class 'http.client.HTTPResponse'>
# data = urllib.request.urlopen(url)
# data.geturl()：http://www.baidu.com
data = urllib.request.urlopen(url).read()
# 编码转换
data = data.decode('UTF-8')
print(data)

可以用type(data)获取data=urllib.request.urlopen(url)的返回类型是：<class 'http.client.HTTPResponse'>；

urlopen返回对象提供方法：

-read() , readline() ,readlines() , fileno() , close() ：这些方法的使用方式与文件对象完全一样

-info()：返回一个httplib.HTTPMessage对象，表示远程服务器返回的头信息

-getcode()：返回Http状态码。如果是http请求，200请求成功完成;404网址未找到

-geturl()：返回请求的url

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pymongo.errors.CursorNotFound: cursor id 1058082xxxxxxxx not found mongo索引超时

一，超時原因數據量太大，mongo 的性能處理不過來數據在處理過程中太耗時二，解決方案爲find() 函數設置 no_cursor_timeout = True，表示遊標連接不會主動關閉（需要手動關閉） items

2020-07-08 12:43:13

python下载地址，windows和mac的都有下载地址

下載安裝的路徑我截圖了，這個是windows的，mac在最下面：地址：https://pan.baidu.com/s/1X7dB_D_xqL878cMeYSvCFw 提取碼：eofi 提取二維碼：下載成功後，新建文件夾，做

2020-07-08 07:54:27

OpenCV读取中文路径图像

引言這幾天做點小東西，涉及到OpenCV讀取中文圖像的問題如果直接讀取中文路徑的圖像，往往返回[] import cv2 cv_im = cv2.imread(‘老乾媽.jpg’) 緣起偶然發現opencv 讀取圖

2020-07-08 01:09:29

ftp-client-1

使用語言：python 2.7 主要模塊：ftplib 主要使用一個while循環，沒有進行完整的異常處理，根據實際需求情況修改！ #coding=utf-8 from ftplib import FTP import sys,

2020-07-07 12:48:50

pyftpdlib代码初印象

添加用戶 from pyftpdlib.authorizers import DummyAuthorizer authorizer = DummyAuthorizer() authorizer.add_user('user',

2020-07-07 12:48:50

pyftpdlib代码实战

新建一個基本的ftp服務器 from pyftpdlib.authorizers import DummyAuthorizer from pyftpdlib.handlers import FTPHandler from pyft

2020-07-07 12:48:50

ftp-client-2

編程語言：python 2.7 主要模塊：ftplib 使用cmd模塊實現交互，沒有完整的異常處理，根據實際情況修改！ #coding=utf-8 from cmd import Cmd from ftplib import

2020-07-07 12:48:50

python脚本导出Elasticsearch数据到csv文件

以下是個導出es數據到csv文件的簡單腳本，腳本簡單易懂，主要解決了兩個問題： Elasticsearch數據含中文寫入csv文件會亂碼 unicode編碼的中文數據寫入csv文件會亂碼 from elasticsearch impor

2020-07-07 11:22:13

python基础之列表推导式

例1： >>> List=[x for x in range(10)] >>> List [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 等價於： >>> List=[] >>> for x in range(10):

2020-07-07 08:38:39

Sublime text3修改tab键为缩进四个空格

在用sublime寫python腳本時，如果混用空格和tab，可能會報錯，因此可以設置將tab改爲4個空格，以便統一格式。添加上圖紅框處代碼即可 # 設置保存時自動轉換 "expand_tabs_on_save": true

weixin_43178406

2020-07-06 18:37:46

Python快乐之旅（基础知识汇总）

點擊就可以跳轉到相關文章了。一、Python語言介紹 Python語言介紹 Python語言的設計哲學編譯型語言和解釋型語言的區別 Python語言類型二、Python開發環境以及開發工具搭建Python開發環境 P

Liuyuelinjiayou

2020-07-06 18:06:36

datetime的操作

from datetime import date, time, datetime, timedelta, tzinfo 1. datetime模塊簡介 python中關於時間的格式：時間對象格式struct_time（

weixin_43178406

2020-07-06 18:01:18

sklearn中f1_score参数解析

1. f1_score sklearn.metrics.f1_score(y_true, y_pred, labels=None, pos_label=1, average=‘binary’, sample_weight=None

weixin_43178406

2020-07-06 18:01:18

python使用flask封装restful API

1. 簡介使用flask封裝，簡單來講就是將python文件引入flask。這樣的結果就是在網頁上輸入一個url就能得到結果。下面就講如何進行實現。 2. 任務1：求兩數之和 2.1 代碼講解新建一個server.py的文件，

weixin_43178406

2020-07-06 18:01:18

java与python类对比

1. 構造器方法和變量 super、self、this 4. python代碼實例 class Test(): # 類屬性 country = '中國' province = '陝西省' c

weixin_43178406

2020-07-06 18:01:18

24小時熱門文章

最新文章

最新評論文章