css偏移反爬蟲

網站中,頁面正常顯示,但是源代碼中確找不到相關的數據,帶是一個或多個帶樣式的標籤。

  css偏移反爬蟲,在反爬技術中也用得比較多的,都是爲阻止爬蟲工程師採集頁面的數據,它的特點在於計算。源代碼中,它們的數據錯亂不堪,但是前端工程師則通過css排版,將源代碼中的數據顯示在頁面中,如果爬蟲程序想正確的得到頁面數據,則要計算出css數據排版規律。

數據呈現:

  css偏移方式有很多種,這裏說說常見的2種。

  1.替換錯誤方式:

    源代碼中,數據在標籤中正常顯示,但是規律是錯誤,對於此類計算,偏移量都在對應的標籤中。如:去那兒旅行網

  2.單獨樣式引用:

    源代碼中,數據在標籤中不正常顯示,都是引用源代碼開頭的style樣式,其中樣式也對各個數據進行偏移和混淆。如 http://glidedsky.com/level/crawler-css-puzzle-1

爬蟲實破:

  對於此此反爬蟲,無非是分析、研究css偏移的規律,再通過代碼去設計對應的規律,來得出正確的值。提一下,此類大多的left的偏移量相關。

練手博文:

glidedsky 反爬練習

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章