C# 讀取Word文檔中的文本內容
這篇文章將介紹如何使用C#和Free Spire.Doc組件讀取Word文檔中的文本內容。Free Spire.Doc提供了兩種方法來讀取Word文檔中的內容,一種是直接獲取文檔中的所有文本內容,另一種是遍歷文檔中的節和其中的段落,然後獲取段落中的文本,下面將逐一介紹這兩種方法。
Word文檔截圖:
在使用以下代碼前,需要先在Visual studio中創建一個C#應用程序,然後引用Spire.Doc.dll到程序中。
方法一 直接獲取所有文本
//加載Word文檔
Document doc = new Document();
doc.LoadFromFile("Input.docx");
//使用GetText方法獲取文檔中的所有文本
string s = doc.GetText();
File.WriteAllText("文本1.txt", s.ToString());
效果圖:
方法二 遍歷段落獲取文本
//加載Word文檔
Document document = new Document();
document.LoadFromFile(@"測試文檔.docx");
StringBuilder sb = new StringBuilder();
//遍歷節和段落,獲取段落中的文本
foreach (Section section in document.Sections)
{
foreach (Paragraph paragraph insection.Paragraphs)
{
sb.AppendLine(paragraph.Text);
}
}
File.WriteAllText("文本2.txt",sb.ToString());
效果圖:
總結
這兩種方法結果都差不多,第一種方法更簡便,通過一個方法可以一次性獲取文檔中的內容,但第二種方法更靈活,可以獲取到文檔中指定節或指定段落中的文本,可以根據自己的需要選擇相應的方法。
---------------------
作者:Eiceblue
來源:CSDN
原文:https://blog.csdn.net/Eiceblue/article/details/79932491