原來寫過一篇網易雲的評論爬取 很不幸沒搞懂js的加密 本次經過b站大佬提供的思路有幸去窺探了一下
首先吧鏈接放出來 av42632011 b站up主的視頻 我講的不好大家可以去看一看
首先對於爬蟲來說反爬很要命 ip池 headers cookies js加密都是大問題
主要說明js加密 js加密根據up主所說都在下圖
首先要會使用chrome工具 {}爲js格式化 ctrl+f爲查找
對於網易雲他有兩個參數
均爲加密參數 加密一般存在於js中然後去sources文件中一個一個去找
這樣就找到了 而且很明顯它是由BY11X這個變量提供的 而 bY11x這個變量由asrsea這個函數賦值的 繼續搜索
很明顯 asrsea由d函數確定 而d函數由四個不知道的值進行傳遞 者可以用斷點進行實驗來找出規律 而後的思路就非常清晰根據
這些函數一個一個的推敲就好 沒有太難的地方 還有一點需要注意 根據up主說有些變量是沒有意義的 因此對於許多不知道從何而來的變量更重要的是試
最後有個問題最近在嘗試珍愛網的登陸 可以也是卡死在js加密上 然而根據up的方法與思路仍然解決不了 ua這個值是怎樣出來的 希望有大佬進行解答 或者一起探討