Word03,07,Excel03,07 通過POI 轉Html

import java.io.BufferedReader;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.text.DecimalFormat;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.HashMap;
import java.util.List;
import java.util.Map;


import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;


import org.apache.commons.io.FileUtils;
import org.apache.poi.hssf.usermodel.HSSFCellStyle;
import org.apache.poi.hssf.usermodel.HSSFDataFormat;
import org.apache.poi.hssf.usermodel.HSSFDateUtil;
import org.apache.poi.hssf.usermodel.HSSFFont;
import org.apache.poi.hssf.usermodel.HSSFPalette;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.hssf.util.HSSFColor;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.converter.PicturesManager;
import org.apache.poi.hwpf.converter.WordToHtmlConverter;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.hwpf.usermodel.PictureType;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.CellStyle;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.usermodel.WorkbookFactory;
import org.apache.poi.ss.util.CellRangeAddress;
import org.apache.poi.xssf.usermodel.XSSFCellStyle;
import org.apache.poi.xssf.usermodel.XSSFColor;
import org.apache.poi.xssf.usermodel.XSSFFont;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.poi.xwpf.converter.core.BasicURIResolver;
import org.apache.poi.xwpf.converter.core.FileImageExtractor;
import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter;
import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.w3c.dom.Document;




/**
 * ClassName: ConverToHtml <br/>
 * Function: word excel轉換html. <br/>
 * Reason: TODO ADD REASON(可選). <br/>
 * date: 2017年9月8日 下午3:15:40 <br/>
 *
 * @author lwy
 * @version
 * @since JDK 1.8
 */
@SuppressWarnings({"rawtypes","unchecked","deprecation"})
public class ConverToHtml {
/**
* converWord:(word轉換成html). <br/>

* @author lwy
* @param path
* @param file
* @param fileName
* @return
* @throws Throwable
* @since JDK 1.8
*/
public static String converWord(String path, String file, String fileName) throws Throwable {

InputStream input = new FileInputStream(path + file);
HWPFDocument wordDocument = new HWPFDocument(input);
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
wordToHtmlConverter.setPicturesManager(new PicturesManager() {
public String savePicture(byte[] content, PictureType pictureType, String suggestedName, float widthInches, float heightInches) {
return suggestedName;
}
});
wordToHtmlConverter.processDocument(wordDocument);
List<Picture> pics = wordDocument.getPicturesTable().getAllPictures();
if (pics != null) {
for (int i = 0; i < pics.size(); i++) {
Picture pic = (Picture) pics.get(i);
try {
pic.writeImageContent(new FileOutputStream(path + pic.suggestFullFileName()));
} catch (FileNotFoundException e) {
e.printStackTrace();
}
}
}
Document htmlDocument = wordToHtmlConverter.getDocument();
ByteArrayOutputStream outStream = new ByteArrayOutputStream();
DOMSource domSource = new DOMSource(htmlDocument);
StreamResult streamResult = new StreamResult(outStream);
TransformerFactory tf = TransformerFactory.newInstance();
Transformer serializer = tf.newTransformer();
serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
serializer.setOutputProperty(OutputKeys.INDENT, "yes");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
outStream.close();
// String result = new String(outStream.toByteArray());
String result = new String(outStream.toString("UTF-8"));
String[] name = fileName.split("\\.");
FileUtils.writeStringToFile(new File(path, name[0] + ".html"), result, "UTF-8");
// System.out.println("result------------" + result);
return result;
}


/**
* converWord07:(word07版本(.docx)轉html poi:word07在線預覽). <br/>

* @author lwy
* @param path
* @param file
* @param fileName
* @return
* @throws IOException
* @since JDK 1.8
*/
public static String converWord07(String path, String file, String fileName) throws IOException {


String result = "";
String[] name = fileName.split("\\.");
File f = new File(path + file);
if (!f.exists()) {
System.out.println("文件不存在!");
} else {
if (f.getName().endsWith(".docx") || f.getName().endsWith(".DOCX")) {
// 讀取文檔內容
InputStream in = new FileInputStream(f);
XWPFDocument document = new XWPFDocument(in);


File imageFolderFile = new File(path);
// 加載html頁面時圖片路徑
XHTMLOptions options = XHTMLOptions.create().URIResolver(new BasicURIResolver("./"));
// //圖片保存文件夾路徑
options.setExtractor(new FileImageExtractor(imageFolderFile));
OutputStream out = new FileOutputStream(new File((path + name[0] + ".html").trim()));
XHTMLConverter.getInstance().convert(document, out, options);
out.close();
BufferedReader reader = new BufferedReader(new FileReader((path + name[0] + ".html")));
String tempString = null;
int line = 1;
// 一次讀入一行,直到讀入null爲文件結束
while ((tempString = reader.readLine()) != null) {
// 顯示行號
System.out.println("line " + line + ": " + tempString);
result = result + tempString;
line++;
}
// System.out.println("result+===================="+result);
reader.close();
}
}
return result;


}


 /**
* Excel 03,07
     * 程序入口方法
     * @param filePath 文件的路徑
     * @param isWithStyle 是否需要表格樣式 包含 字體 顏色 邊框 對齊方式
     * @return <table>...</table> 字符串
     */
    public static String readExcelToHtml(String filePath , boolean isWithStyle){
        
        InputStream is = null;
        String htmlExcel = null;
        try {
            File sourcefile = new File(filePath);
            is = new FileInputStream(sourcefile);
            Workbook wb = WorkbookFactory.create(is);
            if (wb instanceof XSSFWorkbook) {
                XSSFWorkbook xWb = (XSSFWorkbook) wb;
                htmlExcel = getExcelInfo(xWb,isWithStyle);
            }else if(wb instanceof HSSFWorkbook){
                HSSFWorkbook hWb = (HSSFWorkbook) wb;
                htmlExcel = getExcelInfo(hWb,isWithStyle);
            }
            FileUtils.writeStringToFile(new File (filePath+".html"), htmlExcel);
        } catch (Exception e) {
            e.printStackTrace();
        }finally{
            try {
                is.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return filePath+".html";
    }
    
    
public static String readExcelToHtml(String filePath , boolean isWithStyle,InputStream is){
        
     //   InputStream is = null;
        String htmlExcel = null;
        try {
      //      File sourcefile = new File(filePath);
      //      is = new FileInputStream(sourcefile);
            Workbook wb = WorkbookFactory.create(is);
            if (wb instanceof XSSFWorkbook) {
                XSSFWorkbook xWb = (XSSFWorkbook) wb;
                htmlExcel = getExcelInfo(xWb,isWithStyle);
            }else if(wb instanceof HSSFWorkbook){
                HSSFWorkbook hWb = (HSSFWorkbook) wb;
                htmlExcel = getExcelInfo(hWb,isWithStyle);
            }
            FileUtils.writeStringToFile(new File (filePath.subSequence(0, filePath.lastIndexOf("."))+".html"), htmlExcel);
        } catch (Exception e) {
            e.printStackTrace();
        }finally{
            try {
                is.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return filePath+".html";
    }
    
    public static String getExcelInfo(Workbook wb,boolean isWithStyle){
        
        StringBuffer sb = new StringBuffer();
        //獲取excel中有多少工作薄
        int sheets = wb.getNumberOfSheets();
        Sheet sheet =null;
        for(int i=0;i<sheets;i++){
       sheet = wb.getSheetAt(i);//獲取第一個Sheet的內容
       int lastRowNum = sheet.getLastRowNum();
       Map<String, String> map[] = getRowSpanColSpanMap(sheet);
       sb.append("<table style='border-collapse:collapse;' width='100%'>");
       Row row = null;        //兼容
       Cell cell = null;    //兼容
       
       for (int rowNum = sheet.getFirstRowNum(); rowNum <= lastRowNum; rowNum++) {
           row = sheet.getRow(rowNum);
           if (row == null) {
               sb.append("<tr><td > &nbsp;</td></tr>");
               continue;
           }
           sb.append("<tr>");
           int lastColNum = row.getLastCellNum();
           for (int colNum = 0; colNum < lastColNum; colNum++) {
               cell = row.getCell(colNum);
               if (cell == null) {    //特殊情況 空白的單元格會返回null
                   sb.append("<td>&nbsp;</td>");
                   continue;
               }

               String stringValue = getCellValue(cell);
               if (map[0].containsKey(rowNum + "," + colNum)) {
                   String pointString = map[0].get(rowNum + "," + colNum);
                   map[0].remove(rowNum + "," + colNum);
                   int bottomeRow = Integer.valueOf(pointString.split(",")[0]);
                   int bottomeCol = Integer.valueOf(pointString.split(",")[1]);
                   int rowSpan = bottomeRow - rowNum + 1;
                   int colSpan = bottomeCol - colNum + 1;
                   sb.append("<td rowspan= '" + rowSpan + "' colspan= '"+ colSpan + "' ");
               } else if (map[1].containsKey(rowNum + "," + colNum)) {
                   map[1].remove(rowNum + "," + colNum);
                   continue;
               } else {
                   sb.append("<td ");
               }
               
               //判斷是否需要樣式
               if(isWithStyle){
                   dealExcelStyle(wb, sheet, cell, sb);//處理單元格樣式
               }
               
               sb.append(">");
               if (stringValue == null || "".equals(stringValue.trim())) {
                   sb.append(" &nbsp; ");
               } else {
                   // 將ascii碼爲160的空格轉換爲html下的空格(&nbsp;)
                   sb.append(stringValue.replace(String.valueOf((char) 160),"&nbsp;"));
               }
               sb.append("</td>");
           }
           sb.append("</tr>");
       }

       sb.append("</table><br><br><br><br>");
   }
        return sb.toString();
    }
    
    private static Map<String, String>[] getRowSpanColSpanMap(Sheet sheet) {


        Map<String, String> map0 = new HashMap<String, String>();
        Map<String, String> map1 = new HashMap<String, String>();
        int mergedNum = sheet.getNumMergedRegions();
        CellRangeAddress range = null;
        for (int i = 0; i < mergedNum; i++) {
            range = sheet.getMergedRegion(i);
            int topRow = range.getFirstRow();
            int topCol = range.getFirstColumn();
            int bottomRow = range.getLastRow();
            int bottomCol = range.getLastColumn();
            map0.put(topRow + "," + topCol, bottomRow + "," + bottomCol);
            // System.out.println(topRow + "," + topCol + "," + bottomRow + "," + bottomCol);
            int tempRow = topRow;
            while (tempRow <= bottomRow) {
                int tempCol = topCol;
                while (tempCol <= bottomCol) {
                    map1.put(tempRow + "," + tempCol, "");
                    tempCol++;
                }
                tempRow++;
            }
            map1.remove(topRow + "," + topCol);
        }
        Map[] map = { map0, map1 };
        return map;
    }
    
    
    /**
     * 獲取表格單元格Cell內容
     * @param cell
     * @return
     */
    private static String getCellValue(Cell cell) {


        String result = new String();  
        switch (cell.getCellType()) {  
        case Cell.CELL_TYPE_NUMERIC:// 數字類型  
            if (HSSFDateUtil.isCellDateFormatted(cell)) {// 處理日期格式、時間格式  
                SimpleDateFormat sdf = null;  
                if (cell.getCellStyle().getDataFormat() == HSSFDataFormat.getBuiltinFormat("h:mm")) {  
                    sdf = new SimpleDateFormat("HH:mm");  
                } else {// 日期  
                    sdf = new SimpleDateFormat("yyyy-MM-dd");  
                }  
                Date date = cell.getDateCellValue();  
                result = sdf.format(date);  
            } else if (cell.getCellStyle().getDataFormat() == 58) {  
                // 處理自定義日期格式:m月d日(通過判斷單元格的格式id解決,id的值是58)  
                SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd");  
                double value = cell.getNumericCellValue();  
                Date date = org.apache.poi.ss.usermodel.DateUtil  
                        .getJavaDate(value);  
                result = sdf.format(date);  
            } else {  
                double value = cell.getNumericCellValue();  
                CellStyle style = cell.getCellStyle();  
                DecimalFormat format = new DecimalFormat();  
                String temp = style.getDataFormatString();  
                // 單元格設置成常規  
                if (temp.equals("General")) {  
                    format.applyPattern("#");  
                }  
                result = format.format(value);  
            }  
            break;  
        case Cell.CELL_TYPE_STRING:// String類型  
            result = cell.getRichStringCellValue().toString();  
            break;  
        case Cell.CELL_TYPE_BLANK:  
            result = "";  
            break; 
        default:  
            result = "";  
            break;  
        }  
        return result;  
    }
    
    /**
     * 處理表格樣式
     * @param wb
     * @param sheet
     * @param cell
     * @param sb
     */
    private static void dealExcelStyle(Workbook wb,Sheet sheet,Cell cell,StringBuffer sb){
        
        CellStyle cellStyle = cell.getCellStyle();
        if (cellStyle != null) {
            short alignment = cellStyle.getAlignment();
            sb.append("align='" + convertAlignToHtml(alignment) + "' ");//單元格內容的水平對齊方式
            short verticalAlignment = cellStyle.getVerticalAlignment();
            sb.append("valign='"+ convertVerticalAlignToHtml(verticalAlignment)+ "' ");//單元格中內容的垂直排列方式
            
            if (wb instanceof XSSFWorkbook) {
                            
                XSSFFont xf = ((XSSFCellStyle) cellStyle).getFont(); 
                short boldWeight = xf.getBoldweight();
                sb.append("style='");
                sb.append("font-weight:" + boldWeight + ";"); // 字體加粗
                sb.append("font-size: " + xf.getFontHeight() / 2 + "%;"); // 字體大小
                int columnWidth = sheet.getColumnWidth(cell.getColumnIndex()) ;
                sb.append("width:" + columnWidth + "px;");
                
                XSSFColor xc = xf.getXSSFColor();
                if (xc != null && !"".equals(xc)) {
                    sb.append("color:#" + xc.getARGBHex().substring(2) + ";"); // 字體顏色
                }
                
                XSSFColor bgColor = (XSSFColor) cellStyle.getFillForegroundColorColor();
                //System.out.println("************************************");
                //System.out.println("BackgroundColorColor: "+cellStyle.getFillBackgroundColorColor());
                //System.out.println("ForegroundColor: "+cellStyle.getFillForegroundColor());//0
                //System.out.println("BackgroundColorColor: "+cellStyle.getFillBackgroundColorColor());
                //System.out.println("ForegroundColorColor: "+cellStyle.getFillForegroundColorColor());
                //String bgColorStr = bgColor.getARGBHex();
                //System.out.println("bgColorStr: "+bgColorStr);
                if (bgColor != null && !"".equals(bgColor)) {
                    sb.append("background-color:#" + bgColor.getARGBHex().substring(2) + ";"); // 背景顏色
                }
                sb.append(getBorderStyle(0,cellStyle.getBorderTop(), ((XSSFCellStyle) cellStyle).getTopBorderXSSFColor()));
                sb.append(getBorderStyle(1,cellStyle.getBorderRight(), ((XSSFCellStyle) cellStyle).getRightBorderXSSFColor()));
                sb.append(getBorderStyle(2,cellStyle.getBorderBottom(), ((XSSFCellStyle) cellStyle).getBottomBorderXSSFColor()));
                sb.append(getBorderStyle(3,cellStyle.getBorderLeft(), ((XSSFCellStyle) cellStyle).getLeftBorderXSSFColor()));
                    
            }else if(wb instanceof HSSFWorkbook){
                
                HSSFFont hf = ((HSSFCellStyle) cellStyle).getFont(wb);
                short boldWeight = hf.getBoldweight();
                short fontColor = hf.getColor();
                sb.append("style='");
                HSSFPalette palette = ((HSSFWorkbook) wb).getCustomPalette(); // 類HSSFPalette用於求的顏色的國際標準形式
                HSSFColor hc = palette.getColor(fontColor);
                sb.append("font-weight:" + boldWeight + ";"); // 字體加粗
                sb.append("font-size: " + hf.getFontHeight() / 2 + "%;"); // 字體大小
                String fontColorStr = convertToStardColor(hc);
                if (fontColorStr != null && !"".equals(fontColorStr.trim())) {
                    sb.append("color:" + fontColorStr + ";"); // 字體顏色
                }
                int columnWidth = sheet.getColumnWidth(cell.getColumnIndex()) ;
                sb.append("width:" + columnWidth + "px;");
                short bgColor = cellStyle.getFillForegroundColor();
                hc = palette.getColor(bgColor);
                String bgColorStr = convertToStardColor(hc);
                if (bgColorStr != null && !"".equals(bgColorStr.trim())) {
                    sb.append("background-color:" + bgColorStr + ";"); // 背景顏色
                }
                sb.append( getBorderStyle(palette,0,cellStyle.getBorderTop(),cellStyle.getTopBorderColor()));
                sb.append( getBorderStyle(palette,1,cellStyle.getBorderRight(),cellStyle.getRightBorderColor()));
                sb.append( getBorderStyle(palette,3,cellStyle.getBorderLeft(),cellStyle.getLeftBorderColor()));
                sb.append( getBorderStyle(palette,2,cellStyle.getBorderBottom(),cellStyle.getBottomBorderColor()));
            }


            sb.append("' ");
        }
    }
    
    /**
     * 單元格內容的水平對齊方式
     * @param alignment
     * @return
     */
    private static String convertAlignToHtml(short alignment) {


        String align = "left";
        switch (alignment) {
        case CellStyle.ALIGN_LEFT:
            align = "left";
            break;
        case CellStyle.ALIGN_CENTER:
            align = "center";
            break;
        case CellStyle.ALIGN_RIGHT:
            align = "right";
            break;
        default:
            break;
        }
        return align;
    }


    /**
     * 單元格中內容的垂直排列方式
     * @param verticalAlignment
     * @return
     */
    private static String convertVerticalAlignToHtml(short verticalAlignment) {


        String valign = "middle";
        switch (verticalAlignment) {
        case CellStyle.VERTICAL_BOTTOM:
            valign = "bottom";
            break;
        case CellStyle.VERTICAL_CENTER:
            valign = "center";
            break;
        case CellStyle.VERTICAL_TOP:
            valign = "top";
            break;
        default:
            break;
        }
        return valign;
    }
    
    private static String convertToStardColor(HSSFColor hc) {


        StringBuffer sb = new StringBuffer("");
        if (hc != null) {
            if (HSSFColor.AUTOMATIC.index == hc.getIndex()) {
                return null;
            }
            sb.append("#");
            for (int i = 0; i < hc.getTriplet().length; i++) {
                sb.append(fillWithZero(Integer.toHexString(hc.getTriplet()[i])));
            }
        }


        return sb.toString();
    }
    
    private static String fillWithZero(String str) {
        if (str != null && str.length() < 2) {
            return "0" + str;
        }
        return str;
    }
    
    static String[] bordesr={"border-top:","border-right:","border-bottom:","border-left:"};
    static String[] borderStyles={"solid ","solid ","solid ","solid ","solid ","solid ","solid ","solid ","solid ","solid","solid","solid","solid","solid"};


    private static  String getBorderStyle(  HSSFPalette palette ,int b,short s, short t){
         
        if(s==0)return  bordesr[b]+borderStyles[s]+"#d0d7e5 1px;";;
        String borderColorStr = convertToStardColor( palette.getColor(t));
        borderColorStr=borderColorStr==null|| borderColorStr.length()<1?"#000000":borderColorStr;
        return bordesr[b]+borderStyles[s]+borderColorStr+" 1px;";
        
    }
    
    private static  String getBorderStyle(int b,short s, XSSFColor xc){
         
         if(s==0)return  bordesr[b]+borderStyles[s]+"#d0d7e5 1px;";;
         if (xc != null && !"".equals(xc)) {
             String borderColorStr = xc.getARGBHex();//t.getARGBHex();
             borderColorStr=borderColorStr==null|| borderColorStr.length()<1?"#000000":borderColorStr.substring(2);
             return bordesr[b]+borderStyles[s]+borderColorStr+" 1px;";
         }
         
         return "";
    }
    
    public static String converExcel(String path,String file, String fileName ){
   
    return "";
    }
    
public static void main(String[] args) throws Throwable {
//converWord("C:\\Users\\guan\\Desktop\\", "預覽html.doc", "預覽html.doc");
readExcelToHtml("C:\\Users\\guan\\Desktop\\日常進度統計.xlsx",true);
// converWord07("C:\\Users\\guan\\Desktop\\", "投標技術規格文件10.docx", "投標技術規格文件10.docx");

}

}




Excel中圖片轉化不成功,當時也沒有這個需求,所以沒有考慮,需要的自己研究一下


如果需要jar包,可以通過QQ聯繫我 997624779

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章