POI簡單使用和大文件寫優化

一、 POI簡介(Apache POI)

1、什麼是POI

Apache POI是Apache軟件基金會的開放源碼函式庫,POI提供API給Java程序對Microsoft Office格式檔案讀和寫的功能。

  • HSSF - 提供讀寫Microsoft Excel格式檔案的功能。(.xls)
  • XSSF - 提供讀寫Microsoft Excel OOXML格式檔案的功能。(.xlsx)
  • HWPF - 提供讀寫Microsoft Word格式檔案的功能。
  • HSLF - 提供讀寫Microsoft PowerPoint格式檔案的功能。
  • HDGF - 提供讀寫Microsoft Visio格式檔案的功能。

2、官網

http://poi.apache.org/
官網可以找到文檔和每個版本的下載地址

二、準備

1、創建一個普通的maven項目

主要測試操作Excel,有兩種操作方式

  • HSSFWorkbook:是操作Excel2003以前(包括2003)的版本,擴展名是.xls
  • XSSFWorkbook:是操作Excel2007後的版本,擴展名是.xlsx

2、pom中引入xml相關依賴

<dependencies>
    <!--xls(03)-->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi</artifactId>
        <version>3.9</version>
    </dependency>

    <!--xlsx(07)-->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>3.9</version>
    </dependency>
    
    <!--日期格式化工具-->
    <dependency>
        <groupId>joda-time</groupId>
        <artifactId>joda-time</artifactId>
        <version>2.10.1</version>
    </dependency>

    <!--test-->
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.12</version>
    </dependency>
</dependencies>

三、HSSF和XSSF寫

1、HSSFWorkbook

public class ExcelWriteTest {

	@Test
	public void testWriteHSSF() throws IOException {

		// 創建新的Excel 工作簿
		Workbook workbook = new HSSFWorkbook();

		// 在Excel工作簿中建一工作表,其名爲缺省值 Sheet0
		//Sheet sheet = workbook.createSheet();

		// 如要新建一名爲"會員登錄統計"的工作表,其語句爲:
		Sheet sheet = workbook.createSheet("會員登錄統計");

		// 創建行(row 1)
		Row row1 = sheet.createRow(0);

		// 創建單元格(col 1-1)
		Cell cell11 = row1.createCell(0);
		cell11.setCellValue("今日人數");

		// 創建單元格(col 1-2)
		Cell cell12 = row1.createCell(1);
		cell12.setCellValue(666);

		// 創建行(row 2)
		Row row2 = sheet.createRow(1);

		// 創建單元格(col 2-1)
		Cell cell21 = row2.createCell(0);
		cell21.setCellValue("統計時間");

		//創建單元格(第三列)
		Cell cell22 = row2.createCell(1);
		String dateTime = new DateTime().toString("yyyy-MM-dd HH:mm:ss");
		cell22.setCellValue(dateTime);

		// 新建一輸出文件流(注意:要先創建文件夾)
		FileOutputStream out = new FileOutputStream("/usr/local/poi/testHSSF.xls");
		// 把相應的Excel 工作簿存盤
		workbook.write(out);
		// 操作結束,關閉文件
		out.close();
        
		System.out.println("文件生成成功");
	}
}

2、XSSFWorkbook

@Test
public void testWriteXSSF() throws IOException {

    // 創建新的Excel 工作簿
    Workbook workbook = new XSSFWorkbook();

    ......// 和HSSFWorkbook一樣
        
    // 新建一輸出文件流(注意:要先創建文件夾)
    FileOutputStream out = new FileOutputStream("/usr/local/poi/testXSSF.xlsx");
    
    ......
}

3、大文件寫HSSF、XSSF

1)使用HSSF

缺點:最多隻能處理65536行,否則會拋出異常
java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0…65535)
優點:過程中寫入緩存,不操作磁盤,最後一次性寫入磁盤,速度快

@Test
public void testWrite03BigData() throws IOException {
    //記錄開始時間
    long begin = System.currentTimeMillis();

    //創建一個SXSSFWorkbook
    Workbook workbook = new HSSFWorkbook();

    //創建一個sheet
    Sheet sheet = workbook.createSheet();

    //xls文件最大支持65536行
    for (int rowNum = 0; rowNum < 65536; rowNum++) {
        //創建一個行
        Row row = sheet.createRow(rowNum);
        for (int cellNum = 0; cellNum < 10; cellNum++) {//創建單元格
            Cell cell = row.createCell(cellNum);
            cell.setCellValue(cellNum);
        }
    }

    System.out.println("done");
    FileOutputStream out = new FileOutputStream("/usr/local/poi/test-write03-bigdata.xls");
    workbook.write(out);
    // 操作結束,關閉文件
    out.close();

    //記錄結束時間
    long end = System.currentTimeMillis();
    System.out.println((double)(end - begin)/1000);
}

2)使用XSSF

缺點:寫數據時速度非常慢,非常耗內存,也會發生內存溢出,如100萬條
優點:可以寫較大的數據量,如20萬條

@Test
public void testWrite07BigData() throws IOException {
    //記錄開始時間
    long begin = System.currentTimeMillis();

    //創建一個XSSFWorkbook
    Workbook workbook = new XSSFWorkbook();

    ......
        
    FileOutputStream out = new FileOutputStream("/usr/local/poi/test-write07-bigdata.xlsx");
   
    ......
}

3)使用SXSSF

優點:可以寫非常大的數據量,如100萬條甚至更多條,寫數據速度快,佔用更少的內存
注意:
過程中會產生臨時文件,需要清理臨時文件
默認由100條記錄被保存在內存中,如果查過這數量,則最前面的數據被寫入臨時文件
如果想自定義內存中數據的數量,可以使用new SXSSFWorkbook(數量)

@Test
public void testWrite07BigDataFast() throws IOException {
    //記錄開始時間
    long begin = System.currentTimeMillis();

    //創建一個SXSSFWorkbook
    Workbook workbook = new SXSSFWorkbook();

   ......

    FileOutputStream out = new FileOutputStream("xlsx");
    workbook.write(out);
    // 操作結束,關閉文件
    out.close();

    //清除臨時文件
    ((SXSSFWorkbook)workbook).dispose();

    //記錄結束時間
    long end = System.currentTimeMillis();
    System.out.println((double)(end - begin)/1000);
}

四、HSSF和XSSF讀

1、HSSF


public class ExcelReadTest {

	@Test
	public void testRead03() throws Exception{

		InputStream is = new FileInputStream("需要讀取文件的路徑.xls");

		Workbook workbook = new HSSFWorkbook(is);
		Sheet sheet = workbook.getSheetAt(0);

		// 讀取第一行第一列
		Row row = sheet.getRow(0);
		Cell cell = row.getCell(0);

		// 輸出單元內容
		System.out.println(cell.getStringCellValue());

		// 操作結束,關閉文件
		is.close();
	}
}

2、XSSF

@Test
public void testRead07() throws Exception{

    InputStream is = new FileInputStream("需要讀取文件路徑.xlsx");

    Workbook workbook = new XSSFWorkbook(is);
    
    ......
}

3、讀取不同的數據類型

//判斷單元格數據類型
String cellValue = "";
switch (cellType) {
    case HSSFCell.CELL_TYPE_STRING://字符串
        System.out.print("【STRING】");
        cellValue = cell.getStringCellValue();
        break;

    case HSSFCell.CELL_TYPE_BOOLEAN://布爾
        System.out.print("【BOOLEAN】");
        cellValue = String.valueOf(cell.getBooleanCellValue());
        break;

    case HSSFCell.CELL_TYPE_BLANK://空
        System.out.print("【BLANK】");
        break;

    case HSSFCell.CELL_TYPE_NUMERIC:
        System.out.print("【NUMERIC】");
        //cellValue = String.valueOf(cell.getNumericCellValue());

        if (HSSFDateUtil.isCellDateFormatted(cell)) {//日期
            System.out.print("【日期】");
            Date date = cell.getDateCellValue();
            cellValue = new DateTime(date).toString("yyyy-MM-dd");
        } else {
            // 不是日期格式,則防止當數字過長時以科學計數法顯示
            System.out.print("【轉換成字符串】");
            cell.setCellType(HSSFCell.CELL_TYPE_STRING);
            cellValue = cell.toString();
        }
        break;

    case Cell.CELL_TYPE_ERROR:
        System.out.print("【數據類型錯誤】");
        break;
}

4、執行Excel計算公式

@Test
public void testFormula() throws Exception{

    InputStream is = new FileInputStream(".xls");

    Workbook workbook = new HSSFWorkbook(is);
    Sheet sheet = workbook.getSheetAt(0);

    // (假設計算公式在五行第一列)讀取第五行第一列
    Row row = sheet.getRow(4);
    Cell cell = row.getCell(0);

    //公式計算器
    FormulaEvaluator formulaEvaluator = new HSSFFormulaEvaluator((HSSFWorkbook) workbook);

    // 輸出單元內容
    int cellType = cell.getCellType();
    switch (cellType) {
        case Cell.CELL_TYPE_FORMULA://2

            //得到公式
            String formula = cell.getCellFormula();
            System.out.print(formula);

            CellValue evaluate = formulaEvaluator.evaluate(cell);
            //String cellValue = String.valueOf(evaluate.getNumberValue());
            String cellValue = evaluate.formatAsString();
            System.out.println(cellValue);

            break;
    }
}
發佈了71 篇原創文章 · 獲贊 37 · 訪問量 8萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章