java獲取word文檔的條目化內容

在開發Web辦公系統或文檔系統時,PageOffice組件是衆所周知的在線處理微軟word/ppt/excel文檔的強大工具,它對WORD文檔的各種處理在API層面進行了封裝,屏蔽了Office VBA接口的複雜性,而又不失VBA的強大功能,在此要分享的正是PageOffice封裝的一個很強大的功能:獲取word文檔的條目化內容。在一個包含了文檔處理功能的辦公系統裏,用戶出於各種原因,希望能通過程序自動分析word文檔中每個章節的內容也是一種合理的需求,而PageOffice爲實現此功能提供的接口也非常簡單,廢話少說,直接看代碼:

  PageOffice具體的集成過程在此略過。。。(詳細看PageOffice for java 開發包中的安裝說明)

  1. 調用PageOffice在線打開一個包含了章節層次的word文檔,比如:test.doc

PageOfficeCtrl poCtrl=new PageOfficeCtrl(request);
poCtrl.setServerPage(request.getContextPath()+"/poserver.zz");//打開Word文檔poCtrl.webOpen("doc/test.doc",OpenModeType.docNormalEdit,"張佚名");

  2. 在打開word文件的頁面(比如:word.jsp)裏顯示文件的區域添加PageOffice的代碼:

    <div style=" width:1000px; height:650px;">
        <%=poCtrl.getHtmlCode("PageOfficeCtrl1")%>
    </div>

  3. 文件在線打開之後,通過按鈕或其他方式調用執行下面的js,變量txt就可以獲取到文檔條目化的內容:

  var txt = document.getElementById("PageOfficeCtrl1").GetWordItemsConent();

  4. 運行效果:

  

  源碼下載: https://download.csdn.net/download/zi_wu_xian/10404732


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章