既然是入門爬的網站是最簡單的圖片網站 -- 本次我們選取這個圖片網站
現在正是開始 首先我們審覈網站的元素
在這裏我們發現了規則, 通過查看多個圖片路徑我們發現取src路徑都含有 https://cdn.pixabay.com/photo/ 公共部分且圖片格式都爲.jpg
因此正則表達式爲
通過以上的分析我們可以開始寫程序了
執行後即可獲得
教程完畢了,我們在介紹下飛豬爬蟲IP代理
API一次提取方式
既然是入門爬的網站是最簡單的圖片網站 -- 本次我們選取這個圖片網站
現在正是開始 首先我們審覈網站的元素
在這裏我們發現了規則, 通過查看多個圖片路徑我們發現取src路徑都含有 https://cdn.pixabay.com/photo/ 公共部分且圖片格式都爲.jpg
因此正則表達式爲
通過以上的分析我們可以開始寫程序了
執行後即可獲得
教程完畢了,我們在介紹下飛豬爬蟲IP代理
API一次提取方式
shell腳本獲取腳本所在目錄 執行腳本的父目錄不一定是當前的工作目錄。 url=$(dirname $(readlink -f $0))