【Jsoup學習禮記】解析一個HTML字符串

存在問題

來自用戶輸入,一個文件或一個網站的HTML字符串,你可能需要對它進行解析並取其內容,或校驗其格式是否完整,或想修改它。怎麼辦?jsonu能夠幫你輕鬆解決這些問題

解決方法

使用靜態Jsoup.parse(String html) 方法或 Jsoup.parse(String html, String baseUri)示例代碼:

String html = "<html><head><title>First parse</title></head>"
  + "<body><p>Parsed HTML into a doc.</p></body></html>";
Document doc = Jsoup.parse(html);

描述

parse(String html, String baseUri) 這方法能夠將輸入的HTML解析爲一個新的文檔 (Document),參數 baseUri 是用來將相對 URL 轉成絕對URL,並指定從哪個網站獲取文檔。如這個方法不適用,你可以使用 parse(String html) 方法來解析成HTML字符串如上面的示例。.

只要解析的不是空字符串,就能返回一個結構合理的文檔,其中包含(至少) 一個head和一個body元素。

一旦擁有了一個Document,你就可以使用Document中適當的方法或它父類 ElementNode中的方法來取得相關數據。

發佈了26 篇原創文章 · 獲贊 10 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章