【HTTP劫持和DNS劫持】騰訊的實際業務分析

原創

jerome_s

2020-03-28 07:14

簡單介紹一下HTTP劫持和DNS劫持的概念，也就是運營商通過某些方式篡改了用戶正常訪問的網頁，插入廣告或者其他一些雜七雜八的東西。

首先對運營商的劫持行爲做一些分析，他們的目的無非就是賺錢，而賺錢的方式有兩種：

1、對正常網站加入額外的廣告，這包括網頁內浮層或彈出廣告窗口；

2、針對一些廣告聯盟或帶推廣鏈接的網站，加入推廣尾巴。例如普通訪問百度首頁，被前置跳轉爲http://www.baidu.com/?tn=90509114_hao_pg

在具體的做法上，一般分爲DNS劫持和HTTP劫持。

DNS劫持：

一般而言，用戶上網的DNS服務器都是運營商分配的，所以，在這個節點上，運營商可以爲所欲爲。

例如，訪問http://jiankang.qq.com/index.html，正常DNS應該返回騰訊的ip，而DNS劫持後，會返回一個運營商的中間服務器ip。訪問該服務器會一致性的返回302，讓用戶瀏覽器跳轉到預處理好的帶廣告的網頁，在該網頁中再通過iframe打開用戶原來訪問的地址。

HTTP劫持：

在運營商的路由器節點上，設置協議檢測，一旦發現是HTTP請求，而且是html類型請求，則攔截處理。後續做法往往分爲2種，1種是類似DNS劫持返回302讓用戶瀏覽器跳轉到另外的地址，還有1種是在服務器返回的HTML數據中插入js或dom節點（廣告）。

在用戶角度，這些劫持的表現分爲：

1、網址被無辜跳轉，多了推廣尾巴；

2、頁面出現額外的廣告（iframe模式或者直接同頁面插入了dom節點）。

處理辦法：

1、先對外網做檢測，上報被劫持的情況。

對於我這個業務而言，加推廣尾巴沒意義，那麼就剩下植入廣告的問題了。頁面廣告可能通過iframe方式，也可以通過dom節點方式，需要在首頁檢查這兩種情況。

window.addEventListener('DOMNodeInserted', checkDivHijack);    
function checkDivHijack(e) {
        var html = e ? (e.srcElement.outerHTML || e.srcElement.wholeText) : $('html').html();
        var reg = /http:\/\/([^\/]+)\//g;
        var urlList = html.match(reg);
        if (!urlList || urlList.length == 0) {
            return;
        }
        reg = /^http:\/\/(.*\.qq\.com|.*\.gtimg\.cn|.*\.qlogo\.cn|.*\.qpic\.cn|.*\.wanggou\.com)\/$/;
        var hijack = false;
        for (var i = 0; i < urlList.length; i++) {
            if (!reg.test(urlList[i])) {
                hijack = true;
                break;
            }
        }
}

（注：事後發現這個url檢查不夠嚴謹，雖然劫持的情況都能發現，但也把產品原有的一些正常插入做劫持誤報了。例如<a href="http://jiankang.qq.com" data-id="1">，不過這個是小細節，把正則表達式完善一下就ok了)

2、針對被iframe加載的情況，需要先找到運營商設置的劫持規律。

在iframe中的網頁能正常打開，而不是又被攔截加iframe，可能是因爲請求的url上或cookie上運營商做了標記。我們可以利用這個規則，躲過劫持。

3、針對注入dom節點的情況，初始化時做檢查，而且後續dom注入也做檢查。可以檢查dom中是否含有白名單以外的http鏈接，如果有，就可以判定爲http劫持。

4、在前端以外的處理辦法還有

a) 終端攔截所有返回包，判斷ip來自黑名單（劫持的中間ip）則丟棄返回包。

這種做法的原因是，運營商劫持http請求後，並不是完全丟棄請求包，而是做了複製，一份繼續發給目標服務器，另外一份做劫持處理直接返回302。因爲這個302會比目標服務器的正常返回早得多，所以用戶瀏覽器會只認第一個302，而丟棄後到的正常返回。

如果先把第一個302丟棄，等待後續正常返回，則問題解決。

b) 終端攔截請求包，並拆包發送。

運營商一般判斷是否劫持，通過判斷是否HTTP請求。一般只會檢測TCP連接建立後的第一個數據包，如果其是一個完整的HTTP協議纔會被標記；如果並非是一個完整的HTTP協議，由於無法得到足夠多的劫持信息，所以並不會被標記爲HTTP協議。

所以，只要把請求包切得足夠細，就能躲過一部分劫持（如果運營商學習“牆”大力氣做多包攔截就沒轍了）。

5、當然，最終，根本解決辦法是使用HTTPS，不過這個涉及到很多業務的修改，成本較高。如果劫持比例小，也許通過適當的補救做法會更好。

　　來看看檢測到的劫持情況：

總體1500萬pv的業務，一天竟然有100萬的劫持上報，即使排除一半的誤報，也代表說20個用戶中，就接近有1個用戶出現被劫持的情況。

可見，各種小運營商（尤其是移動）的心是有多黑！膽子是有多大！

　　各種劫持的手段都有：

　　1、直接返回一個帶廣告的HTML；

　　2、在原html中插入js，再通過js腳本安插廣告；

　　3、iframe展示原來正常網頁。

　　各種醜惡的嘴臉都被記錄在案：

轉自 https://www.cnblogs.com/kenkofox/p/4919668.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【HTTP劫持和DNS劫持】騰訊的實際業務分析

Spring Cloud 部署時如何使用 Kubernetes 作爲註冊中心和配置中心

Maven 自動打包上傳到私服 Nexus

Eclipse Tomcat 熱部署

我的職場經驗分享 - 黃勇

Zeroc Ice TCP長連接實現推送功能

Java 處理視頻、音頻文件(讀取視頻時長等) - JAVE

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結