Python+django網頁設計入門(9):自定義反爬蟲功能

技術要點:

1)識別請求來自瀏覽器還是來自爬蟲程序,根據不同的訪問方式給出不同的響應。

2)獲取客戶端IP地址並限制其訪問時間間隔,如果來自爬蟲程序,則多次訪問之間的間隔會很短,判斷這種情況並給出相應的響應。

3)使用自定義修飾器實現代碼複用。

===================

1、修改questions應用的views.py文件,導入time標準庫中的time()函數,並定義修飾器函數isCraw()。

2、把定義的修飾器作用到相應的視圖函數上,以登錄界面爲例。

3、執行命令,運行網站,使用瀏覽器打開登錄界面,一切正常。

4、使用Python模塊urllib編寫簡單爬蟲程序,嘗試讀取登錄界面信息,失敗。

5、修改程序,僞裝瀏覽器訪問登錄頁面,成功。

6、進一步修改爬蟲程序,連續多次讀取登錄頁面,第一次成功,後面失敗。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章