JSP頁面的ContentType和pageEncoding的差異

contentType -- 指定的是JSP頁最終 Browser(客戶端)所見到的網頁內容的編碼.就是 Mozilla Character encoding, 或者是 IE6 encoding. 例如 JSPtw Forum 用的contentType就是 Big5.

pageEncoding -- 指定JSP編寫時所用的編碼 
如果你的是 WIN98,  ME NOTEPAD記事本編寫JSP, 就一定是常用的是Big5  gb2312, 如果是用 WIN2k winXPNOTEPAD, SAVE時就可以選擇不同的編,, 包括 ANSI(BIG5/GB2312) UTF-8  UNIONCODE(估是 UCS 16).

因爲 JSP要經過 兩次的"編碼", 
第一階段會用 pageEncoding, 第二階段會用 utf-8 utf-8, 第三階段就是由TOMCAT出來的網頁, 用的是contentType.

階段一是 JSPC JSPJAVA(.java)原碼的"翻譯", 它會跟據 pageEncoding 的設定讀取JSP. 結果是 由指定的pageEncoding(utf-8,Big5,gb2312)JSP 翻譯成統一的utf-8 JAVA原碼(.java). 如果pageEncoding設定錯了, 或沒設定 (預設 ISO8859-1), 出來的 在這個階段 就已是中文亂碼

階段二是由 JAVACJAVA原碼至JAVA BYTECODE的編譯. 不論JSP的編寫時是用(utf-8,Big5,gb2312),經過階段一的結果全是utf-8ENCODINGJAVA源.

JAVAC utf-8ENCODING讀取jAVA原碼, 編譯成字符串是 utf-8 ENCODING的二進制碼(.class). 這是 JAVA VIRTUAL MACNHINE
對常數字符串在 二進制碼(JAVA BYTECODE)內表逹的規範.

階段三是TOMCAT(或其的application container)加載和執行階段二得來的JAVA二進制碼, 輸出的結果( 也就是BROWSER(客戶端))
見到的. 這時一早隱藏在階段一和二的參數contentType, 就發揮了功效. (見 階段一的 ).

response.setContentType("text/html; charset=utf-8");

出來的可以是 utf-8, Big5, gb2312, 看的就是JSP ? contentType的設定.

<%@ page session="false" pageEncoding="big5" contentType="text/html; charset=utf-8" %>

還有, pageEncoding contentType的預設都是 ISO8859-1. 而隨便設定了其中一個, 另一個就跟着一樣了(TOMCAT4.1.27是如此).但這不是絕對, 看的各自JSPC的處理方式. pageEncoding不等於contentType, 更有利亞洲區的文字 CJKVJSP網頁的開發和展示,

(pageEncoding=Big5 不等於 contentType=utf-8).

一個簡單的解決方法是在包含和被包含文件的開始部分都加上:

<%@ page contentType="text/html;charset=GB2312" language="java" %>

發佈了27 篇原創文章 · 獲贊 40 · 訪問量 24萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章