Free Spire.Doc組件C# 讀取Word文檔中的文本內容

C# 讀取Word文檔中的文本內容

這篇文章將介紹如何使用C#和Free Spire.Doc組件讀取Word文檔中的文本內容。Free Spire.Doc提供了兩種方法來讀取Word文檔中的內容,一種是直接獲取文檔中的所有文本內容,另一種是遍歷文檔中的節和其中的段落,然後獲取段落中的文本,下面將逐一介紹這兩種方法。

Word文檔截圖:

在使用以下代碼前,需要先在Visual studio中創建一個C#應用程序,然後引用Spire.Doc.dll到程序中。

方法一 直接獲取所有文本

//加載Word文檔
Document doc = new Document();
doc.LoadFromFile("Input.docx");
 
//使用GetText方法獲取文檔中的所有文本
string s = doc.GetText();
 
File.WriteAllText("文本1.txt", s.ToString());
效果圖:


方法二 遍歷段落獲取文本

//加載Word文檔
Document document = new Document();
document.LoadFromFile(@"測試文檔.docx");
 
StringBuilder sb = new StringBuilder();
 
//遍歷節和段落,獲取段落中的文本
foreach (Section section in document.Sections)
{
    foreach (Paragraph paragraph insection.Paragraphs)
    {
        sb.AppendLine(paragraph.Text);
    }
}
 
File.WriteAllText("文本2.txt",sb.ToString());
效果圖:


總結

這兩種方法結果都差不多,第一種方法更簡便,通過一個方法可以一次性獲取文檔中的內容,但第二種方法更靈活,可以獲取到文檔中指定節或指定段落中的文本,可以根據自己的需要選擇相應的方法。

 


--------------------- 
作者:Eiceblue 
來源:CSDN 
原文:https://blog.csdn.net/Eiceblue/article/details/79932491 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章