Python爬蟲利器六之PyQuery的用法

PyQuery 是 Python 仿照 jQuery 的嚴格實現。語法與 jQuery 幾乎完全相同,所以不用再去費心去記一些奇怪的方法了。

天下竟然有這等好事?我都等不及了!

安裝

有這等神器還不趕緊安裝了!來!

參考來源

本文內容參考官方文檔,更多內容,大家可以去官方文檔學習,畢竟那裏纔是最原汁原味的。

目前版本 1.2.4 (2016/3/24)

官方文檔

簡介

pyquery allows you to make jquery queries on xml documents. The API is
as much as possible the similar to jquery. pyquery uses lxml for fast
xml and html manipulation. This is not (or at least not yet) a library
to produce or interact with JavaScript code. I just liked the jquery
API and I missed it in python so I told myself “Hey let’s make jquery
in python”. This is the result. It can be used for many purposes, one
idea that I might try in the future is to use it for templating with
pure http templates that you modify using pyquery. I can also be used
for web scrapping or for theming applications with Deliverance.

pyquery 可讓你用 jQuery 的語法來對 xml 進行操作。這I和 jQuery 十分類似。如果利用 lxml,pyquery 對 xml 和 html 的處理將更快。

這個庫不是(至少還不是)一個可以和 JavaScript交互的代碼庫,它只是非常像 jQuery API 而已。

初始化

在這裏介紹四種初始化方式。

(1)直接字符串

pq 參數可以直接傳入 HTML 代碼,doc 現在就相當於 jQuery 裏面的 $ 符號了。

(2)lxml.etree

可以首先用 lxml 的 etree 處理一下代碼,這樣如果你的 HTML 代碼出現一些不完整或者疏漏,都會自動轉化爲完整清晰結構的 HTML代碼。

(3)直接傳URL

這裏就像直接請求了一個網頁一樣,類似用 urllib2 來直接請求這個鏈接,得到 HTML 代碼。

(4)傳文件

可以直接傳某個路徑的文件名。

快速體驗

現在我們以本地文件爲例,傳入一個名字爲 hello.html 的文件,文件內容爲

編寫如下程序

運行結果

看,回憶一下 jQuery 的語法,是不是運行結果都是一樣的呢?

在這裏我們注意到了一點,PyQuery 初始化之後,返回類型是 PyQuery,利用了選擇器篩選一次之後,返回結果的類型依然還是 PyQuery,這簡直和 jQuery 如出一轍,不能更贊!然而想一下 BeautifulSoup 和 XPath 返回的是什麼?列表!一種不能再進行二次篩選(在這裏指依然利用 BeautifulSoup 或者 XPath 語法)的對象!

然而比比 PyQuery,哦我簡直太愛它了!

屬性操作

你可以完全按照 jQuery 的語法來進行 PyQuery 的操作。

運行結果

再來一發

運行結果

依舊是那麼優雅與自信!

在這裏我們發現了,這是一連串的操作,而 p 是一直在原來的結果上變化的。

因此執行上述操作之後,p 本身也發生了變化。

DOM操作

同樣的原汁原味的 jQuery 語法

運行結果

這不需要多解釋了吧。

DOM 操作也是與 jQuery 如出一轍。

遍歷

遍歷用到 items 方法返回對象列表,或者用 lambda

運行結果

不過最常用的還是 items 方法

網頁請求

PyQuery 本身還有網頁請求功能,而且會把請求下來的網頁代碼轉爲 PyQuery 對象。

感受一下,GET,POST,樣樣通。

Ajax

PyQuery 同樣支持 Ajax 操作,帶有 get 和 post 方法,不過不常用,一般我們不會用 PyQuery 來做網絡請求,僅僅是用來解析。

PyQueryAjax

API

最後少不了的,API大放送。

API

原汁原味最全的API,都在裏面了!如果你對 jQuery 語法不熟,強烈建議先學習下 jQuery,再回來看 PyQuery,你會感到異常親切!

結語

用完了 PyQuery,我已經深深愛上了他!

你呢?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章