[補充] java之正則表達式 網絡爬蟲

   //爬出指定網站的郵箱地址

public static void WangL() throws Exception

    {
        URL u = new URL("需要爬蟲的郵箱地址");
        URLConnection cn  =  u.openConnection();
        BufferedReader buin  =  new BufferedReader(new InputStreamReader(cn.getInputStream()));
        String ss =  null;
        String   regex = "\\w+@\\w+(\\.\\w+)+"; // 定義規則
        
        Pattern  p = Pattern.compile(regex); //  將規則封裝成對象;
        
        while((ss = buin.readLine())!=null)
        {
            Matcher  m  =  p.matcher(ss);  //將規則與操作的字符進行關聯;
            while(m.find())
            {
                System.out.println(m.group());
            }
        }
        
        
        
    }

}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章