之前用Node.js做個小程序,來實現校園網流量的查詢,以及對我校bt種子區搜索條目刷單。當時用的是http.request(option,callback)
方法,但返回的請求出現了亂碼的問題,這可把我給愁壞了。後來找到了方法,在這分享以方便遇到同樣問題的同學。
首先,show the code:
var http=require('http');
var options={
hostname:'...',
port:80,
path:'/bt.php?'+searchstring,
method:'GET'
};
var req=http.request(options,(res)=>{
var header=res.headers;
console.log(`STATUS: ${res.statusCode}`);
console.log(`HEADERS: ${JSON.stringify(res.headers)}`);
res.setEncoding('utf8');
var html='';
res.on('data',(data)=>{
html+=data;
})
res.on('end',()=>{
console.log(html);
})
});
req.on('error',error=>{console.log("error:"+error.message)});
//req.write(searchstring);//因爲我用的是get方法,所以並不用寫數據到請求頭
req.end();
這樣寫貌似沒有問題,但實際運行的時候卻發現返回的響應數據是亂碼,那怎麼辦,得找原因吧,按我爲數不多的經驗來講一般是編碼的問題,但代碼中我明確指定了所用編碼方式爲“utf8”而且響應頭中字符編碼方式確實是“utf8”,不信你看返回的響應頭:
HEADERS: {"server":"Tengine","date":"Fri, 17 Feb 2017 14:03:58 GMT","content-type":"text/html; charset=utf-8","transferencoding":"chunked","connection":"keep-alive","set-cookie":[/*略去*/],"content-encoding":"gzip","vary":"Accept-Encoding"}
那是什麼原因那?我注意到內容編碼方式爲“gzip”,gzip壓縮方式不就是壓縮html、css、js文件什麼的,減少體積以加快響應嘛。難道是它的問題?是因爲gzip壓縮使得返回的內容無法用utf8全部解出來導致出現亂碼嗎?當時我是半信半疑,先抱着試試的態度找下解決方案,費了好大功夫終於在stackoverflow中找到了解決方案(How to use request or http module to read gzip page into a string),看來還是stackoverflow大法好,最終解決方案如下:
var req=http.request(options,(res)=>{
var header=res.headers;
console.log(`STATUS: ${res.statusCode}`);
console.log(`HEADERS: ${JSON.stringify(res.headers)}`);
var html='',output;
if(res.headers['content-encoding']=='gzip'){
var gzip=zlib.createGunzip();
res.pipe(gzip);
output=gzip;
}else{
output=res;
}
output.on('data',(data)=>{
data=data.toString('utf-8');
html+=data;
});
output.on('end',()=>{
console.log(html);
})
});
req.on('error',error=>{console.log("error:"+error.message)});
req.end();
就這樣我成功解決了一大難題,哈哈哈!