自学Python 3网络爬虫（二）

原創

星空下的那个人影

2018-08-28 12:26

import urllib
import urllib.request

data = {}
data['word'] = '广东珠海'

url_values = urllib.parse.urlencode(data)
url = "http://www.baidu.com/s?"
full_url = url + url_values
print(full_url)

data = urllib.request.urlopen(full_url).read()
data = data.decode("UTF-8")
print(data)

urllib.parse.urlencode(data)是将data里的key-value这样的键值对转换成word=%E5%B9%BF%E4%B8%9C%E7%8F%A0%E6%B5%B7

生成的full_url是：http://www.baidu.com/s?word=%E5%B9%BF%E4%B8%9C%E7%8F%A0%E6%B5%B7

我们打开这个网址所在的页面：

查看该页面的源代码（截取一段）：

再看看我们通过urllib库搜索出来的代码片段（同样截取一段）：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pymongo.errors.CursorNotFound: cursor id 1058082xxxxxxxx not found mongo索引超时

一，超時原因數據量太大，mongo 的性能處理不過來數據在處理過程中太耗時二，解決方案爲find() 函數設置 no_cursor_timeout = True，表示遊標連接不會主動關閉（需要手動關閉） items

2020-07-08 12:43:13

python下载地址，windows和mac的都有下载地址

下載安裝的路徑我截圖了，這個是windows的，mac在最下面：地址：https://pan.baidu.com/s/1X7dB_D_xqL878cMeYSvCFw 提取碼：eofi 提取二維碼：下載成功後，新建文件夾，做

2020-07-08 07:54:27

OpenCV读取中文路径图像

引言這幾天做點小東西，涉及到OpenCV讀取中文圖像的問題如果直接讀取中文路徑的圖像，往往返回[] import cv2 cv_im = cv2.imread(‘老乾媽.jpg’) 緣起偶然發現opencv 讀取圖

2020-07-08 01:09:29

ftp-client-1

使用語言：python 2.7 主要模塊：ftplib 主要使用一個while循環，沒有進行完整的異常處理，根據實際需求情況修改！ #coding=utf-8 from ftplib import FTP import sys,

2020-07-07 12:48:50

pyftpdlib代码初印象

添加用戶 from pyftpdlib.authorizers import DummyAuthorizer authorizer = DummyAuthorizer() authorizer.add_user('user',

2020-07-07 12:48:50

pyftpdlib代码实战

新建一個基本的ftp服務器 from pyftpdlib.authorizers import DummyAuthorizer from pyftpdlib.handlers import FTPHandler from pyft

2020-07-07 12:48:50

ftp-client-2

編程語言：python 2.7 主要模塊：ftplib 使用cmd模塊實現交互，沒有完整的異常處理，根據實際情況修改！ #coding=utf-8 from cmd import Cmd from ftplib import

2020-07-07 12:48:50

python脚本导出Elasticsearch数据到csv文件

以下是個導出es數據到csv文件的簡單腳本，腳本簡單易懂，主要解決了兩個問題： Elasticsearch數據含中文寫入csv文件會亂碼 unicode編碼的中文數據寫入csv文件會亂碼 from elasticsearch impor

2020-07-07 11:22:13

python基础之列表推导式

例1： >>> List=[x for x in range(10)] >>> List [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 等價於： >>> List=[] >>> for x in range(10):

2020-07-07 08:38:39

Sublime text3修改tab键为缩进四个空格

在用sublime寫python腳本時，如果混用空格和tab，可能會報錯，因此可以設置將tab改爲4個空格，以便統一格式。添加上圖紅框處代碼即可 # 設置保存時自動轉換 "expand_tabs_on_save": true

weixin_43178406

2020-07-06 18:37:46

Python快乐之旅（基础知识汇总）

點擊就可以跳轉到相關文章了。一、Python語言介紹 Python語言介紹 Python語言的設計哲學編譯型語言和解釋型語言的區別 Python語言類型二、Python開發環境以及開發工具搭建Python開發環境 P

Liuyuelinjiayou

2020-07-06 18:06:36

datetime的操作

from datetime import date, time, datetime, timedelta, tzinfo 1. datetime模塊簡介 python中關於時間的格式：時間對象格式struct_time（

weixin_43178406

2020-07-06 18:01:18

sklearn中f1_score参数解析

1. f1_score sklearn.metrics.f1_score(y_true, y_pred, labels=None, pos_label=1, average=‘binary’, sample_weight=None

weixin_43178406

2020-07-06 18:01:18

python使用flask封装restful API

1. 簡介使用flask封裝，簡單來講就是將python文件引入flask。這樣的結果就是在網頁上輸入一個url就能得到結果。下面就講如何進行實現。 2. 任務1：求兩數之和 2.1 代碼講解新建一個server.py的文件，

weixin_43178406

2020-07-06 18:01:18

java与python类对比

1. 構造器方法和變量 super、self、this 4. python代碼實例 class Test(): # 類屬性 country = '中國' province = '陝西省' c

weixin_43178406

2020-07-06 18:01:18

24小時熱門文章

最新文章

最新評論文章