java判斷文件的真實類型

在文件傳輸過程中,爲了安全驗證,對於手工改動文件後綴名產生的僞造文件進行判斷過濾。

比如,我們需要的是excel文件,如果不加驗證內容,將一些可執行的文件通過更改後綴傳輸給你,就是一個很大的漏洞了。

java判斷文件真實類型依靠的是文件的頭部編碼信息,具體代碼如下:

<span style="font-size:12px;">package com.zhuifeng.util.excel;

import java.io.FileInputStream;
import java.io.IOException;
import java.util.HashMap;

/**
 * @author guoxk
 * 
 * @version 創建時間 2016年7月17日 上午10:47:26
 * 
 * 類描述:獲取和判斷文件頭信息 
 *    |--文件頭是位於文件開頭的一段承擔一定任務的數據,一般都在開頭的部分。
 *    |--頭文件作爲一種包含功能函數、數據接口聲明的載體文件,用於保存程序的聲明(declaration),而定義文件用於保存程序的實現(implementation)。
 *    |--爲了解決在用戶上傳文件的時候在服務器端判斷文件類型的問題,故用獲取文件頭的方式,直接讀取文件的前幾個字節,來判斷上傳文件是否符合格式。
 * 
 */
public class CheckExcelFileTypeUtil {
	// 緩存文件頭信息-文件頭信息
	public static final HashMap<String, String> mFileTypes = new HashMap<String, String>();
	static {
		// images
		mFileTypes.put("FFD8FF", "jpg");
		mFileTypes.put("89504E47", "png");
		mFileTypes.put("47494638", "gif");
		mFileTypes.put("49492A00", "tif");
		mFileTypes.put("424D", "bmp");
		//
		mFileTypes.put("41433130", "dwg"); // CAD
		mFileTypes.put("38425053", "psd");
		mFileTypes.put("7B5C727466", "rtf"); // 日記本
		mFileTypes.put("3C3F786D6C", "xml");
		mFileTypes.put("68746D6C3E", "html");
		mFileTypes.put("44656C69766572792D646174653A", "eml"); // 郵件
		mFileTypes.put("D0CF11E0", "doc");
		mFileTypes.put("D0CF11E0", "xls");//excel2003版本文件
		mFileTypes.put("5374616E64617264204A", "mdb");
		mFileTypes.put("252150532D41646F6265", "ps");
		mFileTypes.put("255044462D312E", "pdf");
		mFileTypes.put("504B0304", "docx");
		mFileTypes.put("504B0304", "xlsx");//excel2007以上版本文件
		mFileTypes.put("52617221", "rar");
		mFileTypes.put("57415645", "wav");
		mFileTypes.put("41564920", "avi");
		mFileTypes.put("2E524D46", "rm");
		mFileTypes.put("000001BA", "mpg");
		mFileTypes.put("000001B3", "mpg");
		mFileTypes.put("6D6F6F76", "mov");
		mFileTypes.put("3026B2758E66CF11", "asf");
		mFileTypes.put("4D546864", "mid");
		mFileTypes.put("1F8B08", "gz");
	}

	/**
	 * @author guoxk
	 *
	 * 方法描述:根據文件路徑獲取文件頭信息
	 * @param filePath 文件路徑
	 * @return 文件頭信息
	 */
	public static String getFileType(String filePath) {
//		System.out.println(getFileHeader(filePath));
//		System.out.println(mFileTypes.get(getFileHeader(filePath)));
		return mFileTypes.get(getFileHeader(filePath));
	}

	/**
	 * @author guoxk
	 *
	 * 方法描述:根據文件路徑獲取文件頭信息
	 * @param filePath 文件路徑
	 * @return 文件頭信息
	 */
	public static String getFileHeader(String filePath) {
		FileInputStream is = null;
		String value = null;
		try {
			is = new FileInputStream(filePath);
			byte[] b = new byte[4];
			/*
			 * int read() 從此輸入流中讀取一個數據字節。int read(byte[] b) 從此輸入流中將最多 b.length
			 * 個字節的數據讀入一個 byte 數組中。 int read(byte[] b, int off, int len)
			 * 從此輸入流中將最多 len 個字節的數據讀入一個 byte 數組中。
			 */
			is.read(b, 0, b.length);
			value = bytesToHexString(b);
		} catch (Exception e) {
		} finally {
			if (null != is) {
				try {
					is.close();
				} catch (IOException e) {
				}
			}
		}
		return value;
	}

	/**
	 * @author guoxk
	 *
	 * 方法描述:將要讀取文件頭信息的文件的byte數組轉換成string類型表示
	 * @param src 要讀取文件頭信息的文件的byte數組
	 * @return   文件頭信息
	 */
	private static String bytesToHexString(byte[] src) {
		StringBuilder builder = new StringBuilder();
		if (src == null || src.length <= 0) {
			return null;
		}
		String hv;
		for (int i = 0; i < src.length; i++) {
			// 以十六進制(基數 16)無符號整數形式返回一個整數參數的字符串表示形式,並轉換爲大寫
			hv = Integer.toHexString(src[i] & 0xFF).toUpperCase();
			if (hv.length() < 2) {
				builder.append(0);
			}
			builder.append(hv);
		}
//		System.out.println(builder.toString());
		return builder.toString();
	}
	/**
	 * @author guoxk
	 *
	 * 方法描述:測試
	 * @param args
	 * @throws Exception
	 */
	public static void main(String[] args) throws Exception {
		final String fileType = getFileType("E:\\補貼名單.xls");
		System.out.println(fileType);
	}</span><span style="font-family: Arial, Helvetica, sans-serif;"></span><pre name="code" class="java"><span style="font-size:12px;">}</span>



發佈了34 篇原創文章 · 獲贊 15 · 訪問量 11萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章