Java 讀取本地和在線 html文檔

原創

2020-06-24 16:59

由於業務需要，有時會需要讀取一個html模板。

有這麼一個需求：需要讀取html文件的“body”內容，但是不想要這個body裏面的某一個<h2> 元素，如果用正則表達式來進行匹配的話，會非常消耗性能。可以考慮使用這個方法

<!doctype html>
<html>
    <head>
      
        <meta http-equiv='Content-Type' content='text/html; charset=utf-8'>
        
        <title>helloWorld--zxk</title>
       
        <meta name='description' content=''>
     </head>
<body>
     <h2 class="rich_media_title" id="activity-name">
     <!-- 設置標題 -->
     #titleName#
     </h2>
     <div>
     </div>
     <h2>1111</h2>
 </body>
</html>

下面是Java代碼

	public static String readTxtFileBodyDoc(String filePath) {
		StringBuilder sb = new StringBuilder();
		try {
			String encoding = "UTF-8";
//讀取本地的html文件方法
			File file = new File(filePath);
			if (file.isFile() && file.exists()) { // 判斷文件是否存在
				// 進行body元素提取
				Document document = null;
				document = Jsoup.parse(file, encoding);
				Element e = document.body();
				Element e1 = e.getElementById("activity-name");
//排除 某一個<h2>元素
				e1.remove();
				String eStr = String.valueOf(e);
				sb.append(eStr);
			}
            if (StringUtils.isEmpty(sb)) {
//讀取線上的html文件地址
			try {
				Document doc = Jsoup.connect(filePath).get();
				Element e = doc.body();
				Element e1 = e.getElementById("activity-name");
				e1.remove();
				String eStr = String.valueOf(e);
				sb.append(eStr);

			} catch (Exception e) {
				
			}
			
		}
		} catch (Exception e) {
            e.printStackTrace();
        }
		String bodyCont = sb.toString();
        return bodyCont;
	}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Java 讀取本地和在線 html文檔

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

HTML 00 Tutorial

全面系統的AI學習路徑，幫助普通人也能玩轉AI

從零開始：使用 Playwright 腳本錄製實現自動化測試

uni-app實現上拉加載

玩轉 Spring boot 系列：（一）使用 Idea 搭建 Spring boot Maven 多模塊父子工程（圖解）

網址URL轉義，特殊字符編碼HTTP URL編碼表

Java 讀取本地和在線 html文檔

【2020】微信接口調用返回碼一覽表

SpringBoot的高級特性

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結