response.setHeader()

response.setHeader()下載中文文件名亂碼問題 收藏
1. HTTP消息頭

(1)通用信息頭

即能用於請求消息中,也能用於響應信息中,但與被傳輸的實體內容沒有關係的信息頭,如Data,Pragma

主要: Cache-Control , Connection , Data , Pragma , Trailer , Transfer-Encoding , Upgrade

(2)請求頭

用於在請求消息中向服務器傳遞附加信息,主要包括客戶機可以接受的數據類型,壓縮方法,語言,以及客戶計算機上保留的信息和發出該請求的超鏈接源地址等.

主要: Accept , Accept-Encoding , Accept-Language , Host ,

(3)響應頭

用於在響應消息中向客戶端傳遞附加信息,包括服務程序的名稱,要求客戶端進行認證的方式,請求的資源已移動到新地址等.

主要: Location , Server , WWW-Authenticate(認證頭)

(4)實體頭

用做實體內容的元信息,描述了實體內容的屬性,包括實體信息的類型,長度,壓縮方法,最後一次修改的時間和數據的有效期等.

主要: Content-Encoding , Content-Language , Content-Length , Content-Location , Content-Type

(4)擴展頭

主要:Refresh, Content-Disposition

2. 幾個主要頭的作用

(1)Content-Type的作用

該實體頭的作用是讓服務器告訴瀏覽器它發送的數據屬於什麼文件類型。

例如:當Content-Type 的值設置爲text/html和text/plain時,前者會讓瀏覽器把接收到的實體內容以HTML格式解析,後者會讓瀏覽器以普通文本解析.

(2)Content-Disposition 的作用

當Content-Type 的類型爲要下載的類型時 , 這個信息頭會告訴瀏覽器這個文件的名字和類型。

在講解這個內容時,張老師同時講出瞭解決中文文件名亂碼的解決方法,平常想的是使用getBytes() , 實際上應使用email的附件名編碼方法對文件名進行編碼,但IE不支持這種作法(其它瀏覽器支持) , 使用javax.mail.internet.*包的MimeUtility.encodeWord("中文.txt")的方法進行編碼。

Content-Disposition擴展頭的例子:

<%@ page pageEncoding="GBK" contentType="text/html;charset=utf-8" import="java.util.*,java.text.*" %>

<%=DateFormat.getDateTimeInstance(DateFormat.SHORT, DateFormat.SHORT, Locale.CHINA).format(new Date())

%>

<%

               response.setHeader("Content-Type","video/x-msvideo");

               response.setHeader("Content-Disposition", "p_w_upload;filename=aaa.doc");

%>

Content-Disposition中指定的類型是文件的擴展名,並且彈出的下載對話框中的文件類型圖片是按照文件的擴展名顯示的,點保存後,文件以filename的值命名,保存類型以Content中設置的爲準。

注意:在設置Content-Disposition頭字段之前,一定要設置Content-Type頭字段。

(3)Authorization頭的作用

Authorization的作用是當客戶端訪問受口令保護時,服務器端會發送401狀態碼和WWW-Authenticate響應頭,要求客戶機使用Authorization來應答。

例如:

<%@ page pageEncoding="GBK" contentType="text/html;charset=utf-8" import="java.util.*,java.text.*" %>

<%=DateFormat.getDateTimeInstance(DateFormat.SHORT, DateFormat.SHORT, Locale.CHINA).format(new Date())

%>

<%

response.setStatus(401);

response.setHeader("WWW-Authenticate", "Basic realm=\"Tomcat Manager Application\"");

%>

3.如何實現文件下載

要實現文件下載,我們只需要設置兩個特殊的相應頭,它們是什麼頭?如果文件名帶中文,該如何解決?

兩個特殊的相應頭:

----Content-Type:       application/octet-stream

----Content-Disposition: p_w_upload;filename=aaa.zip

例如:

response.setContentType("p_w_picpath/jpeg");response.setHeader("Content- Disposition","p_w_upload;filename=Bluehills.jpg");

如果文件中filename參數中有中文,則就會出現亂碼。

解決辦法:

(1)MimeUtility.encodeWord("中文.txt");//現在版本的IE還不行

(2)new String("中文".getBytes("GB2312"),"ISO8859- 1");//實際上這個是錯誤的

4. 測試並分析文件名亂碼問題

response.setHeader()下載中文文件名亂碼問題

response.setHeader("Content-Disposition", "p_w_upload; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));

下載的程序裏有了上面一句,一般在IE6的下載提示框上將正確顯示文件的名字,無論是簡體中文,還是日文。不過當時確實沒有仔細測試文件名爲很長的中文文件名的情況。現如今經過仔細測試,發現文字只要超過17個字,就不能下載了。分析如下:

一. 通過原來的方式,也就是先用URLEncoder編碼,當中文文字超過17個時,IE6 無法下載文件。這是IE的bug,參見微軟的知識庫文章 KB816868 。原因可能是IE在處理 Response Header 的時候,對header的長度限制在150字節左右。而一個漢字編碼成UTF-8是9個字節,那麼17個字便是153個字節,所以會報錯。而且不跟後綴也不對.

二. 解決方案:將文件名編碼成ISO8859-1是有效的解決方案,代碼如下:

response.setHeader( "Content-Disposition", "p_w_upload;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) );

在確保附件文件名都是簡體中文字的情況下,那麼這個辦法確實是最有效的,不用讓客戶逐個的升級IE。如果臺灣同胞用,把gb2312改成big5就行。但現在的系統通常都加入了 國際化的支持,普遍使用UTF-8。如果文件名中又有簡體中文字,又有繁體中文,還有日文。那麼亂碼便產生了。另外,在上Firefox (v1.0-en)下載也是亂碼。

三. 參看郵件中的中文附件名的形式,用outlook新建一個帶有中文附件的郵件,然後看這個郵件的源代碼,找到:

Content-Disposition: p_w_upload;

filename="=?gb2312?B?0MK9qCDOxLG+zsS1tS50eHQ=?="

用這個filename原理上就可以顯示中文名附件,但是現在IE並不支持,Firefox是支持的。嘗試使用 javamail 的MimeUtility.encode()方法來編碼文件名,也就是編碼成 =?gb2312?B?xxxxxxxx?= 這樣的形式,並從 RFC1522 中找到對應的標準支持。

折中考慮,結合了一、二的方式,代碼片斷如下:

String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");

/*

* see http://support.microsoft.com/default.aspx?kbid=816868

*/

if (fileName.length() > 150) {

String guessCharset = xxxx

//根據request的locale 得出可能的編碼,中文操作系統通常是gb2312

fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");

}

response.setHeader("Content-Disposition", "p_w_upload; filename=" + fileName);

編碼轉換的原理:

首先在源程序中將編碼設置成GB2312字符編碼,然後將源程序按Unicode編碼轉換成字節碼加載到內存中(java加載到內存中的字節碼都是Unicode編碼),然後按GB2312編碼獲得中文字符串的字節數組,然後生成按ISO8859-1編碼形式的Unicode字符串(這時的4個字節就變成了8個字節,高位字節補零),

java培訓   北京java培訓 java培訓班   java就業培訓 java培訓機構 軟件培訓 最好的java培訓

當在網絡中傳輸時,因爲setHeader方法中的字符只能按ISO8859-1傳輸,所以這時候就又把Unicode字符轉換成了ISO8859-1的編碼傳到瀏覽器(就是把剛纔高位補的零全去掉),這時瀏覽器接收到的ISO8859-1碼的字符因爲符合GB2312編碼,所以就可以顯示中文了。

5. jsp翻譯成class時的編碼問題

記事本中代碼塊1:

<%=

       "a中文".length()

%>

代碼塊2:

<%@ page pageEncoding="gbk"%>

<%=

       "a中文".length()

%>

爲什麼上面的輸出值爲5,改成下面的則輸出3?

因爲上面的代碼沒有添加該文件的編碼說明 , WEB應用程序在將jsp翻譯成class文件時 , 把該字符串的內容按默認的保存方式指定的編碼ASCII碼來算的,在UTF-8中,原ASCII字符佔一個字節,漢字佔兩個字節,對應兩個字符,長度就變成了5 , 而下面的是GBK編碼, 一個漢字和一個英文都對應一個字符,得到結果就爲3.


]


response.setHeader(...)文件名中有空格的時候

String fileName = StringUtils.trim(file.getName());

String formatFileName = encodingFileName(name);//在後面定義方法encodingFileName(String fileName);
response.setHeader("Content-Disposition", "p_w_upload; filename=" + formatFileName );

//處理文件名中出現的空格 

//其中%20是空格在UTF-8下的編碼

public static String encodingFileName(String fileName) {
        String returnFileName = "";
        try {
            returnFileName = URLEncoder.encode(fileName, "UTF-8");
            returnFileName = StringUtils.replace(returnFileName, "+", "%20");
            if (returnFileName.length() > 150) {
                returnFileName = new String(fileName.getBytes("GB2312"), "ISO8859-1");
                returnFileName = StringUtils.replace(returnFileName, " ", "%20");
            }
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
            if (log.isWarnEnabled()) {
                log.info("Don't support this encoding ...");
            }
        }
        return returnFileName;
    }

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章