【Jsoup學習禮記】解析一個body片斷

原創

2020-06-21 04:10

問題

假如你有一個HTML片斷 (比如. 一個 div 包含一對 p 標籤; 一個不完整的HTML文檔) 想對它進行解析。這個HTML片斷可以是用戶提交的一條評論或在一個CMS頁面中編輯body部分。

辦法

使用Jsoup.parseBodyFragment(String html)方法.

String html = "<div><p>Lorem ipsum.</p>";
Document doc = Jsoup.parseBodyFragment(html);
Element body = doc.body();

說明

parseBodyFragment 方法創建一個空殼的文檔，並插入解析過的HTML到body元素中。假如你使用正常的 Jsoup.parse(String html) 方法，通常你也可以得到相同的結果，但是明確將用戶輸入作爲 body片段處理，以確保用戶所提供的任何糟糕的HTML都將被解析成body元素。

Document.body() 方法能夠取得文檔body元素的所有子元素，與 doc.getElementsByTag("body")相同。

保證安全Stay safe

假如你可以讓用戶輸入HTML內容，那麼要小心避免跨站腳本攻擊。利用基於 Whitelist 的清除器和 clean(String bodyHtml, Whitelist whitelist)方法來清除用戶輸入的惡意內容。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

基於阿里雲服務網格流量泳道的全鏈路流量管理（三）：無侵入式的寬鬆模式泳道

作者：尹航在前文《基於阿里雲服務網格流量泳道的全鏈路流量管理（一）：嚴格模式流量泳道》、《基於阿里雲服務網格流量泳道的全鏈路流量管理（二）：寬鬆模式流量泳道》中，我們介紹了流量泳道的概念、使用流量泳道進行全鏈路灰度管理的方案，以及阿里雲服

2024-06-05 21:13:51

爬取京東商品圖片的Python實現方法

引言在數據驅動的商業環境中，網絡爬蟲技術已成爲獲取信息的重要手段。京東作爲中國領先的電商平臺，擁有海量的商品信息和圖片資源。本文將詳細介紹如何使用Python編寫爬蟲程序，爬取京東商品的圖片，並提供完整的代碼實現過程。爬蟲基礎在開

2024-06-12 00:06:03

雲原生週刊：Kubernetes 十週年｜ 2024.6.11

開源項目推薦 Kubernetes Goat Kubernetes Goat 是一個故意設計成有漏洞的 Kubernetes 集羣環境，旨在通過交互式實踐場地來學習並練習 Kubernetes 安全性。 kube-state-metrics

2024-06-11 23:16:00

「Java開發指南」如何使用Spring註釋器實現Spring控制器？（一）

本教程將引導您使用Spring Annotator實現Spring控制器，標準Java類被添加到搭建項目中，Spring Annotator Spring啓用Java類。雖然本教程的重點是Spring控制器，但是Spring Annota

2024-06-11 12:18:10

奇怪！應用的日誌呢？？

1. 問題回顧問題背景是在進行中臺應用中間件遷移過程中，發現存在項目啓動失敗或者項目正常啓動（jsf正常掛載並正常運行，mq正常發送和消費）但是無任何日誌打印現象。更奇怪的是不打印日誌竟然是偶發的，在測試環境中多次部

2024-06-11 11:55:14

華爲雲短信服務教你用C++實現Smgp協議

本文分享自華爲雲社區《華爲雲短信服務教你用C++實現Smgp協議》，作者：張儉。引言&協議概述中國聯合網絡通信有限公司短消息網關係統接口協議（SGIP）是中國網通爲實現短信業務而制定的一種通信協議，全稱叫做Short Message

2024-06-11 10:57:30

從缺陷到創新：質量保障的新視角

1.背景：最近一段時間研發大佬們在積極的治理告警，經過一段時間的治理，現在告警情況已經有了很大的改觀，但難免還有漏網之魚；具體我們可以以下邊一個例子來看：這是一個生產的UMP告警，通過這個告警我們發現XXX這個應用的堆內存使用率

2024-06-07 23:55:01

CI+GPT雙引擎驅動，開啓AI代碼評審新紀元

一. 現狀問題代碼評審 Code Review 是提高代碼質量、促進團隊合作、知識間共享的關鍵環節，對於系統代碼質量和穩定性都至關重要。【人爲代碼評審（Code Review）】存在很多弊端時間消耗大：代碼評審是一

京東雲開發者

2024-06-07 23:54:54

Java開發必讀，談談對Spring IOC與AOP的理解

本文分享自華爲雲社區《超詳細的Java後臺開發面試題之Spring IOC與AOP》，作者：GaussDB 數據庫。一、前言 IOC和AOP是Spring中的兩個核心的概念，下面談談對這兩個概念的理解。二、IOC（Inverse o

2024-06-07 22:57:21

Junit4遇上chatGPT

這是一篇適合Java工程師體質的AI開發教程。本教程會教你寫一個簡單的junit4的Rule，該Rule在基於junit4的測試方法失敗後，自動向GPT發送錯誤信息並通過GPT分析得出代碼修改建議。首先向AI問好簡單的通過AI，讓它

2024-06-06 23:55:13

一文搞懂 Spring 循環依賴

這個其實是一個特別高頻的面試題，松哥也一直很想和大家仔細來聊一聊這個話題，網上關於這塊的文章很多，但是我一直覺得要把這個問題講清楚還有點難度，今天我來試一試，看能不能和小夥伴們把這個問題梳理清楚，當然，如果小夥伴們覺得看文章不過癮，松哥也有

2024-06-06 13:11:47

營銷系統黑名單優化：位圖的應用解析

背景營銷系統中，客戶投訴是業務發展的一大阻礙，一般會過濾掉黑名單高風險賬號，並配合頻控策略，來減少客訴，進而增加營銷效率，減少營銷成本，提升營銷質量。營銷系統一般是通過大數據分析建模，在CDP（客戶數據平臺，以客戶爲核心，圍繞數據融

京東雲開發者

2024-06-06 11:54:12

沒時間瞭解技術熱點？讓大模型幫你整理重點吧！

1. 前言提問：技術人的精神食糧是什麼❓ AI給出的第一條是“知識與學習”。學習的方式有很多種，對筆者而言瞭解新技術和新熱點是保持職業熱愛很重要的方式。完成日常工作是保證物質基礎，人終究還是想追求一些精神價值?*。

2024-06-11 11:55:13

代碼高手的過節祕籍：CodeArt Snap幫寫代碼，靈感彈指間實現

本文分享自華爲雲社區《【端午特輯】代碼高手的過節祕籍：CodeArt Snap幫寫代碼，靈感彈指間實現》，作者：華爲雲社區精選。端午將至，糉葉飄香，你卻還在爲一行行代碼頭疼？與bug纏鬥不休？現在，基於盤古大模型技術打造的華爲雲智能開

2024-06-07 22:57:17

大模型應用之基於Langchain的測試用例生成

一用例生成實踐效果在組內的日常工作安排中，持續優化測試技術、提高測試效率始終是重點任務。近期，我們在探索實踐使用大模型生成測試用例，期望能夠藉助其強大的自然語言處理能力，自動化地生成更全面和高質量的測試用例。當前，公司已經普及使用J

2024-06-06 23:55:14

24小時熱門文章

最新文章

最新評論文章