java獲取網頁源碼

01 package gogo.cool;
02 
03 import java.io.BufferedReader;
04 import java.io.IOException;
05 import java.io.InputStreamReader;
06 import java.net.HttpURLConnection;
07 import java.net.URL;
08 
09 public class test1 {
10 
11     public static void main(String[] a) throws IOException {
12 
13         String url = "http://www.baidu.com";
14 
15         System.out.println(getHTML(url, "gbk")); // 使用原網頁裏聲明的gb2312反而會出現亂碼
16 
17     }
18 
19     public static String getHTML(String pageURL, String encoding) {
20 
21         StringBuilder pageHTML = new StringBuilder();
22 
23         try {
24 
25             URL url = new URL(pageURL);
26 
27             HttpURLConnection connection = (HttpURLConnection) url
28                     .openConnection();
29 
30             connection.setRequestProperty("User-Agent", "MSIE 7.0");
31 
32             BufferedReader br = new BufferedReader(new InputStreamReader(
33                     connection.getInputStream(), encoding));
34 
35             String line = null; 
36 
37             while ((line = br.readLine()) != null) {
38 
39                 pageHTML.append(line);
40 
41                 pageHTML.append("\r\n");
42 
43             }
44 
45             connection.disconnect();
46 
47         } catch (Exception e) {
48 
49             e.printStackTrace();
50 
51         }
52 
53         return pageHTML.toString();
54 
55     }
56 }



發佈了28 篇原創文章 · 獲贊 7 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章