本文介紹如何通過Java後端程序代碼來展示如何將html轉爲XML。此功能通過採用Word API- Free Spire.Doc for Java 提供的Document.saveToFile()方法來實現;該方法支持的目標文檔格式多達 30餘種。另外,該API也提供了多種方法,如Document.saveToEpub()、Document.saveToFile()、Document.saveToImages()、Document.saveToSVG()、Document.saveToTxt()、Document.saveToTiff()等,可用於將源文件轉爲Epub、圖片、文本文件等目標文檔格式。
下面,將以html轉爲xml格式爲例,介紹如何實現轉換。以下是詳細方法及步驟。
【關於如何導入jar包】
通過 Maven倉庫 下載導入,如下配置pom.xml:
<repositories> <repository> <id>com.e-iceblue</id> <url>https://repo.e-iceblue.cn/repository/maven-public/</url> </repository> </repositories> <dependencies> <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.doc.free</artifactId> <version>5.2.0</version> </dependency> </dependencies>
如需手動導入,需要下載 jar包 到本地,然後解壓,找到lib文件夾下的Spire.Doc.jar文件。在IDEA中打開“Project Structure”界面,執行如圖步驟將本地路徑下的jar文件手動引入Java程序:
【將 HTML 轉爲 XML】
轉換時,可參考如下代碼步驟:
- 創建Document類的對象。
- 調用Document.loadFromFile(String fileName, FileFormat fileFormat)方法加載HTML文件。
- 通過Document.saveToFile(String fileName, FileFormat fileFormat)方法保存爲XML格式到指定路徑。
Java
import com.spire.doc.*; public class HTMLtoXML { public static void main(String[] args) { //創建Document類的對象 Document doc = new Document(); //加載html文件 doc.loadFromFile("sample.html",FileFormat.Html); //保存爲XML格式 doc.saveToFile("HTMLtoXML.xml", FileFormat.Xml); } }
轉換效果:
—END—