別問,看。
大衆點評的網頁地址:
http://www.dianping.com/shop/G6LElBf9f5vcLmw3
爬蟲獲取的html源碼:
被加密了,採用了woff字體文件進行映射,需要獲取字體文件,查看woff:在html頭部有個css連接:
<link rel="stylesheet" type="text/css" href="//s3plus.meituan.net/v1/mss_0a06a471f9514fc79c981b5466f56b91/svgtextcss/fe0442f34a887eb95c4422a7a612e517.css">
打開看到:
這些就是解碼文件,下載到本地。然後進入下面網站:
http://blog.luckly-mjw.cn/tool-show/iconfont-preview/index.html
打開7c4ff942.woff、278d416d.woff,看到:
這個就是解密的密碼錶。比如html文件的:
泡泡瑪<e class="address"></e>
就是泡泡馬特