-
直接搜索下載並註冊(一定要註冊)gooseeker,傻瓜式安裝後打開
-
在頂上搜索欄出輸入想爬取的網站,此處以爬取2345天氣網
http://tianqi.2345.com/today-57516.htm
-
點擊ms謀數臺
-
輸入需要爬取的網址,後按回車,等待網頁加載完畢
-
點擊彈出工作臺,如果工作臺未關閉的就跳過該步
-
創建命令規則並查重,直到不重複爲止。
顯示可用即可
-
創建規則
點擊新建
輸入名字確定即可
創好之後如下
-
右鍵點擊之前的名字→添加→包容,並命名你想爬取的內容,隨後在之前添加好的那個上添加,其後
定義好後點擊第一個並勾選上關鍵內容
-
點擊你想爬取的內容並在網頁標籤中找到text在謀數臺中查看是否是需要的屬性,是就在text處右鍵點擊並內容映射,選擇對應的名稱標記即可
-
點擊tianqi勾選啓用,如果出現問題,就按照之前的步驟檢查
-
使用樣例複製我們需要爬取的排行榜結構都是一樣的,我們上一步只是完成了第一名數據的抓取,想要抓取更多的評論就需要進行樣例複製。
找到包含整個數據的標籤右鍵點擊依次選擇第一個第二個
結果如圖
12. 點擊測試,獲取結果,