如何在C#中解析Excel公式

前言

在日常工作中,我們經常需要在Excel中使用公式對錶中數據進行計算(求和、求差和求均值等)和分析,從而實現對數據的分類,通常情況下,當數據量較少或場景變化單一的情況下,使用公式可以滿足用戶的要求,但當數據量較大或者場景變化複雜的情況下,使用公式也無法滿足用戶的需求的情況。這個時候就可以用編碼的方式來解決,以下面的背景需求爲例,小編將爲大家介紹如何使用葡萄城公司基於 .NET 和 .NET Core 平臺的服務端高性能表格組件組件GrapeCity Documents for Excel (以下簡稱GcExcel)解析Excel中的現有公式並根據需求對其進行修改。

背景需求

下圖是一張銷售數據表,左側顯示原始銷售數據,包括銷售代表的姓名、地區、產品和銷售數量,右側顯示了從原始數據中提取的特定的銷售代表對應的銷售分析結果,以及每個產品區域組合的月度銷售目標進度。目標進度的標準如下:

  • 低於 2500:低於目標
  • 超過 3000:達到目標
  • 超過 5000:高於目標

一般情況下,我們使用Excel中的 IF、ISNUMBER 和 FILTER 函數就可以實現將左側的銷售原始數據轉化爲右側的銷售分析結果,如下所示:

=IF(ISNUMBER(FILTER(A2:D19,A2:A19="Fritz")),IFS(FILTER(A2:D19,A2:A19="Fritz")>5000,"Above Target",FILTER(A2:D19,A2:A19="Fritz")>3000,"On Target",FILTER(A2:D19,A2:A19="Fritz")<2500,"Below Target"),FILTER(A2:D19,A2:A19="Fritz"))

但是這樣的話就會出現一個問題,對於不同的人名,小編需要將上面公式中銷售代表的姓名進行替換,也就是需要不斷地手動改變姓名執行操作,這一舉動不僅枯燥,而且很容易出錯。因此這個時候就可以使用GcExcel通過解析公式並使用解析的語法樹輕鬆替換銷售代表姓名,可以簡化此任務。

使用 C# 解析和修改 Excel 公式

首先,創建一個新的 C#(.NET Core) 項目,並使用NuGet 包管理器安裝 GcExcel 包,然後按照前面的步驟操作。

1、使用示例數據初始化工作簿

實例化 Workbook 類的實例並從 Excel 文件導入示例數據,如下所示。

//Create a new workbook
var workbook = new GrapeCity.Documents.Excel.Workbook();           
//Load sample data from excel file
workbook.Open("SampleData.xlsx");
//Enable dynamic array formula
workbook.AllowDynamicArray = true;

2、提取公式

在工作簿加載示例數據和預期公式後,我們從工作表中提取所需的公式,以便使用 Formula 屬性進行解析和修改。

GcExcel API 提供的公式解析器希望傳遞的公式不帶“=”(等於)運算符,以便成功進行公式解析。因此,請注意如何在不使用“=”運算符的情況下提取公式。

//Fetch worksheet
var worksheet = workbook.Worksheets[0];
//Fetch the original formula which needs to be parsed.
var originalFormula = worksheet.Range["H3"].Formula.Substring(1);

3、解析公式

調用 FormulaSynatxTree 類的 Parse 方法來解析公式並生成語法樹,幫助您理解公式包含的所有不同類型的值、運算符和函數。

公式語法樹的每個標記都由 GcExcel API 中的其他類表示,例如函數的 FunctionNode、運算符的 OperatorNode 等。

下面的代碼解析了上一步中提取的銷售分析公式。然後,它將生成的 FormulaSyntaxTree 中的值附加到工作簿,該工作簿隨後保存爲 Excel 文件,以幫助您瞭解公式的語法樹。

//Method to parse a formula and print the syntax tree
public static void ParseAndPrint(IWorksheet worksheet, string formula)
{
   // Get syntax tree
   var syntaxTree = FormulaSyntaxTree.Parse(formula);

   // Flatten nodes
   var displayItems = new List<(string TypeName, int IndentLevel, string Content)>();

   void flatten(SyntaxNode node, int level)
   {
      displayItems.Add((node.GetType().Name, level, node.ToString()));
      foreach (var child in node.Children)
      {
         flatten(child, level + 1);
      }
   }

   flatten(syntaxTree.Root, 0);

   // Output          
   worksheet.ShowRowOutline = false;
   worksheet.OutlineColumn.ColumnIndex = 1;

   // Header
   worksheet.Range["A1"].Value = "Formula";
   worksheet.Range["A3"].Value = "Syntax node";
   worksheet.Range["B3"].Value = "Part";

   // Values
   worksheet.Range["B1"].Value = "'=" + formula;
   for (var i = 0; i < displayItems.Count; i++)
   {
      var item = displayItems[i];
      var text = "'" + item.TypeName;

      worksheet.Range[i + 4, 0].Value = text;
      worksheet.Range[i + 4, 0].IndentLevel = item.IndentLevel;
      worksheet.Range[i + 4, 1].Value = "'" + item.Content;
   }

   //Apply styling
   worksheet.Range["A1:B3"].Interior.Color = System.Drawing.Color.FromArgb(68, 114, 196);
   worksheet.Range["A1:B3"].Font.Color = System.Drawing.Color.White;
   worksheet.Range["A1:B3"].Borders.Color = System.Drawing.Color.FromArgb(91, 155, 213);
   worksheet.Range["A1:B3"].Borders.LineStyle = BorderLineStyle.Thin;
   worksheet.Range["A1,A3,B3"].Font.Size = 14;
   worksheet.Range["A1,A3,B3"].Font.Bold = true;
   worksheet.Range["A:C"].EntireColumn.AutoFit();           
}

下圖是生成的 FormulaSyntaxTree 的效果圖圖。請注意,這只是完整語法樹的一部分:

4、修改公式

從上一步生成的語法樹中,您可以看到銷售代表姓名以 TextNode 形式表示,並且在公式中多次出現。我們可以通過簡單的查找和替換操作來替換所有這些出現的情況,如下面的代碼所示:

  1. 了替換公式中的銷售代表姓名,我們從他們的姓名列表開始。我們使用 UNIQUE 函數從原始數據中過濾掉唯一名稱列表。然後使用這個 UNIQUE 函數的結果來解析和修改所有銷售代表的銷售分析公式。
  2. 我們使用 TextNode 類修改銷售代表姓名。下面的代碼初始化 TextNode 類的實例,並將要在公式中搜索的銷售代表姓名作爲參數傳遞。該實例可以稱爲查找節點。
  3. 接下來,我們初始化 TextNode 類的另一個實例,並將公式中要替換的銷售代表姓名作爲參數傳遞。該實例可以稱爲替換節點。
  4. 下面的代碼中定義了一個遞歸函數 replaceNode,用於遍歷語法樹的所有子節點,並將每個出現的 Find 節點替換爲 Replace 節點。每個銷售代表都會重複此操作。
  5. 修改公式後,新公式將分配給工作表中的單元格以生成預期的銷售報告。

下面的代碼包含一些格式化代碼來格式化銷售報告內容。

//Method to parse and modify the formula
public static void ModifyFormula(IWorksheet worksheet, string originalFormula)
{
    //Apply UNIQUE formula to get unique sales representatives list
    worksheet.Range["F1"].Value = "Unique Rep";
    worksheet.Range["F2"].Formula = "=UNIQUE(A2:A19)";
    var uniqueRep = worksheet.Range["F2#"];
    // Apply Styling
    worksheet.Range["F:F"].EntireColumn.AutoFit();
    worksheet.Range["F1"].Interior.Color = System.Drawing.Color.FromArgb(68, 114, 196);
    worksheet.Range["F1"].Font.Color = System.Drawing.Color.White;
    worksheet.Range["F2#"].Borders.Color = System.Drawing.Color.FromArgb(91, 155, 213);
    worksheet.Range["F2#"].Borders.LineStyle = BorderLineStyle.Thin;

    //Get syntax tree
    var syntaxTree = FormulaSyntaxTree.Parse(originalFormula);

    //Find
    var findText = new TextNode("Fritz");

    //Replacement
    var replaceText = new TextNode("");

    //Loop through names list to modify the formula for each sales representative
    for (int r = 0, resultRow = 3; r < uniqueRep.Cells.Count; r++, resultRow = resultRow + 4)
    {
       //Get name to be replaced in the formula
       var cval = uniqueRep.Cells[r].Value.ToString();

       if (findText.Value != cval)
       {
          //Assign name to be replaced to Replace TextNode
          replaceText.Value = cval;

          //Invoke the recursive method to perform find and replace operation
          replaceNode(syntaxTree.Root, findText, replaceText);

          //Assign the modified formula to a cell in the worksheet
          var resultRange = "H" + resultRow.ToString();
          worksheet.Range[resultRange].Formula = "=" + syntaxTree.ToString();
          worksheet.Range[resultRange + "#"].Borders.Color = System.Drawing.Color.FromArgb(91, 155, 213);
          worksheet.Range[resultRange + "#"].Borders.LineStyle = BorderLineStyle.Thin;

          //Update the value of Find node to perform find and replace operation for next sales representative name
          findText = replaceText;
       }
    }

    //Find and replace
    void replaceNode(SyntaxNode lookIn, SyntaxNode find, SyntaxNode replacement)
    {
       var children = lookIn.Children;

       for (var i = 0; i < children.Count; i++)
       {
          var child = children[i];
          if (child.Equals(find))
          {
             children[i] = replacement;
          }
          else
          {
             replaceNode(child, find, replacement);
          }
       }
    }
 }

這是修改後的公式之一:

=IF(ISNUMBER(FILTER(A2:D19,A2:A19="Xi")),IFS(FILTER(A2:D19,A2:A19="Xi")>5000,"Above Target",FILTER(A2:D19,A2:A19="Xi")>3000,"On Target",FILTER(A2:D19,A2:A19="Xi")<2500,"Below Target"),FILTER(A2:D19,A2:A19="Xi"))

5、保存 Excel 文件

將所有修改的公式添加到工作表後,將調用 Workbook 類的 Save 方法來保存 Excel 文件,如下面的代碼所示:

//Save modified Excel file
workbook.Save("ModifiedFormula.xlsx", SaveFileFormat.Xlsx);

打開保存的 Excel 文件可以看到下圖:

總結

以上就是使用C#實現解析Excel的全過程,如果您想了解更多信息,歡迎點擊這裏查看更多資料。

擴展鏈接:

輕鬆構建低代碼工作流程:簡化繁瑣任務的利器

優化預算管理流程:Web端實現預算編制的利器

如何在.NET電子表格應用程序中創建流程圖

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章