C#導入導出與處理Excel文件

前一段時間接了一個小項目,使用C#寫一個Winform客戶端。主要功能就是根據客戶提供的文件標準,按照一定的規則和算法,轉換DBF文件和Excel文件(後綴名xlsx爲主)。這個客戶端的功能並不複雜,但是細節很多,前前後後從框架到交付大約用了三週的時間。我先闡述使用C#語言處理Excel文件的一些實踐結論。

由於我處理的是後綴名爲xlsx文件,再次就主講此類文件了。在Excel文件的輸入中,使用的就是度娘一找一大片的OleDB

OleDB是微軟的戰略性的通向不同的數據源的低級應用程序接口。支持很多種數據庫,此客戶端中DBF文件的輸入輸出也是使用了此數據庫API。使用OleDB記得添加上命名空間:

using System.Data.OleDb;

xlsx文件的輸入:

private void inputXlsx()
{
    string strConn2;
    string filePath = inPath;
    FileInfo fileInfo = new FileInfo(filePath);
    string directory = fileInfo.DirectoryName;

    strConn2 = @"Provider=Microsoft.ACE.OLEDB.12.0;Data Source='{0}';Extended Properties='Excel 8.0;HDR=Yes;IMEX=1;';";
    string strConnection = string.Format(strConn2, inPath);
        OleDbConnection conn = new OleDbConnection(strConnection);
    try
    {
        conn.Open();
        String tableName = null;
        DataTable dt = conn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, null);
            tableName = dt.Rows[0][2].ToString().Trim();
        OleDbDataAdapter oada = new OleDbDataAdapter("select * from [" + tableName + "]", strConnection);
        oada.Fill(dtOld);
        conn.Close();   
    }
    catch (Exception ex)
    {
        conn.Close();
    }
}

xlsx文件的中間處理過程因需求而異,在此不再贅述處理方式。在輸入過程中,將文件中的數據轉化成了Datatable數據類型的格式,它是一個臨時保存數據的網格虛擬表,處理非常方便。

xlsx文件的輸出:xlsx文件的輸出過程並不是很順利,先後使用了三種方式。

第一種方式自然就是OleDB了,有始有終嘛。但是真正使用的過程中發現此方式不僅要求程序運行本機必須安裝Excel,而且對Excel版本要求非常高,如果刪註冊表很容易弄巧成拙,我改註冊表就直接玩壞了Excel。事實上我們並不能保證客戶的機器上一定安裝了對應版本的Excel,所以如果使用OleDB輸出文件,此客戶端的兼容性將非常的低劣。

經過一番溝通和掙扎決定還是換一種方式,決定改用第三方組件。由於JAVA方使用的是POI,所以這邊直接使用POI項目的.NET版本,NPOI。網上教程很多,很好實現,但是經過測試之後,此種方式對大文件的輸入輸出支持的不是很好,處理DEMO文件沒有問題,但是換成了真正客戶提供的十萬行級甚至百萬行級的文件,客戶端直接在輸出的過程中崩掉。

查詢資料後,網友們對於大文件都建議使用EPPlus。教程也是一抓一大把,我沒有繼續加大文件大小測試,不過客戶給我們提供的十來個文件全部測試通過,基本上都是百萬級以下的。

上代碼吧:

private void outputXlsx()
{
    FileInfo newFile = new FileInfo(dtNew.TableName + ".xlsx");
    if (newFile.Exists)
    {
        newFile.Delete();
        newFile = new FileInfo(dtNew.TableName + ".xlsx");
    }
    using (ExcelPackage package = new ExcelPackage(newFile))
    {
        ExcelWorksheet worksheet = package.Workbook.Worksheets.Add(dtNew.TableName);//創建worksheet

        for (int m = 0; m < dtNew.Columns.Count; m++)
        {
            worksheet.Cells[1, m + 1].Value = dtNew.Columns[m];
        }
        int i = 1;
        foreach (DataRow dr in dtNew.Rows)
        {
            for (int j = 0; j < dtNew.Columns.Count; j++)
            {
                worksheet.Cells[i + 1, j + 1].Value = dr[j];
            }
            i++;
        }
        package.Save();//保存excel
    }
}
發佈了49 篇原創文章 · 獲贊 96 · 訪問量 17萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章