解決JSP中亂碼問題

家在JSP的開發過程中,經常出現中文亂碼的問題,可能一至困擾着大家,現把JSP開發中遇到的中文亂碼的問題及解決辦法寫出來供大家參考。首先了解一下Java中文問題的由來:

Java的內核和class文件是基於unicode的,這使Java程序具有良好的跨平臺性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,JavaJSP文件本身編譯時產生的亂碼問題和Java程序於其他媒介交互產生的亂碼問題。首先Java(包括JSP)源文件中很可能包含有中文,而JavaJSP源文件的保存方式是基於字節流的,如果JavaJSP編譯成class文件過程中,使用的編碼方式與源文件的編碼不一致,就會出現亂碼。基於這種亂碼,建議在Java文件中儘量不要寫中文(註釋部分不參與編譯,寫中文沒關係),如果必須寫的話,儘量手動帶參數-ecoding GBK或-ecoding gb2312或-ecoding UTF-8編譯;對於JSP,在文件頭加上<%@ page contentType="text/html;charset=GBK"%>

<%@ page contentType="text/html;charset=gb2312"%>基本上就能解決這類亂碼問題。

 

下面是一些常見中文亂碼問題的解決方法(下面例子中ecoding採用的是gb2312,也可設爲ecoding GBKecoding UTF-8):

一、 JSP頁面亂碼

這種亂碼問題比較簡單,一般是頁面編碼不一致導致的亂碼,一般新手容易出現這樣的問題,具體分以下兩種情況:

Ø 未指定使用字符集編碼

下面的顯示頁面(display.jsp)就出現亂碼:

 

<html>

<head>

<title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html charset=gb2312">

</head>

<body>

<%out.print("JSP的中文處理");%>

</body>

</html>
 

這種亂碼的原因是沒有在頁面裏指定使用的字符集編碼,JSP頁面中出現了中文字符,而默認的ISO-8859-1字符集中無中文字符,解決方法:只要在頁面開始地方用下面代碼指定字符集編碼即可,在JSP頁面中指定編碼方式(gb2312),和瀏覽器解碼方式設置相同,即在頁面的第一行加上:

<%@ page contentType="text/html; charset=gb2312"%>,就可以消除亂碼了。

完整頁面如下:

<%@ page contentType="text/html; charset=gb2312"%>

<html>

<head>

<title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html charset=gb2312">

</head>

<body>

<%out.print("JSP的中文處理");%>

</body>

</html>
 

 

Ø 編碼字符集設置不一致

下面的顯示頁面(display.jsp)就出現亂碼:

 

<%@ page language="java" pageEncoding="gb2312"%>

<%@ page contentType="text/html;charset=iso8859-1"%>

<html>

<head>

<title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html charset=gb2312">

</head>

<body>

<%out.print("JSP的中文處理");%>

</body>

</html>
 

 

這個出現亂碼原因是由於頁面編碼不一致導致的亂碼,在這個例子中我們可以看到有三處設置字符集的地方,下面分別瞭解一下這三處設置具體含義:

第一處<%@ page language="java" pageEncoding="gb2312"%>的編碼格式爲jsp文件的存儲格式。Eclipse會根據這個編碼格式保存文件。並編譯jsp文件,包括裏面的漢字。
第二處編碼爲解碼格式。因爲存爲gb2312的文件被解碼爲iso8859-1,這樣如有中文肯定出亂碼。也就是必須一致。而第二處所在的這一行,可以沒有。缺省也是使用iso8859-1的編碼格式。所以如果沒有這一行的話,也會出現亂碼。必須一致纔可以。

第三處編碼爲控制瀏覽器的解碼方式。如果前面的解碼都一致並且無誤的話,這個編碼格式用不用設置都可以。有的網頁出現亂碼,就是因爲瀏覽器不能確定使用哪種編碼格式。因爲頁面有時候會嵌入頁面,導致瀏覽器混淆了編碼格式出現了亂碼。

完整解決代碼如下:

<%@ page language="java" pageEncoding="gb2312"%>

<%@ page contentType="text/html;charset= gb2312"%>

<html>

<head>

<title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html charset=gb2312">

</head>

<body>

<%out.print("JSP的中文處理");%>

</body>

</html>
 

 

二、 表單提交中文時出現亂碼

下面是一個提交頁面(submit.jsp),代碼如下:

<%@ page contentType="text/html; charset=gb2312"%>

<html>

<head><title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html; charset=gb2312">

</head>

<body>

<form name="form1" method="post/get" action="process.jsp">

<div align="center">

<input type="text" name="name">

<input type="submit" name="Submit" value="Submit">

</div>

</form>

</body>

</html>
 

 

 

下面是處理頁面(process.jsp)代碼:

 

<%@ page contentType="text/html; charset=gb2312"%>

<html>

<head>

<title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html; charset=gb2312">

</head>

<body>

<%=request.getParameter("name")%>

</body>

</html>
 

如果submit.jsp提交英文字符能正確顯示,如果提交中文時就會出現亂碼。原因:瀏覽器默認使用UTF-8編碼方式來發送請求,而UTF- 8GB2312編碼方式表示字符時不一樣,這樣就出現了不能識別字符。

Ø POST提交方式

解決辦法:

A、 接受參數時進行編碼轉換

String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;

修改後的process.jsp代碼如下:

<%@ page contentType="text/html; charset=gb2312"%>

<html>

<head>

<title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html; charset=gb2312">

</head>

<body>

<%

String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;

out.print(s);

%>

</body>

</html>
 

 

 

如果使用該方法的話,每一個參數都必須這樣進行轉碼。很麻煩。但確實可以拿到漢字。

B、通過request.seCharacterEncoding ("gb2312")對請求進行統一編碼,就實現了中文的正常顯示。

修改後的process.jsp代碼如下:

 

<%@ page contentType="text/html; charset=gb2312"%>

<%request.seCharacterEncoding("gb2312");%>

<html>

<head>

<title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html; charset=gb2312">

</head>

<body>

<%=request.getParameter("name")%>

</body>

</html>
 

 

如果使用該方法接受此參數的頁面就不必在轉碼了,即可得到漢字參數。但每頁都需要執行這句話。

C爲了避免每頁都要寫request.setCharacterEncoding("gb2312"),可以使用過濾器對所有jsp

進行編碼處理。就是使用Servlet規範中的過慮器指定編碼,主要代碼如下:

 

import java.io.*;

import javax.servlet.Filter;

import javax.servlet.FilterChain;

import javax.servlet.FilterConfig;

import javax.servlet.ServletException;

import javax.servlet.ServletRequest;

import javax.servlet.ServletResponse;

public class SetCharacterEncodingFilter implements Filter {

protected String encoding = null;

public void destroy(){

this.encoding = null;

}

public void init(FilterConfig filterConfig) throws ServletException

{

this.encoding = filterConfig.getInitParameter("encoding");

}

public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException

{

request.setCharacterEncoding(encoding);

response.setContentType(
"text/html;charset="+encoding);

chain.doFilter(request, response);

}

}
 

 

 

過濾器在web.xml中的配置如下:

 

<filter>

<filter-name>SetCharacterEncodingFilter</filter-name>

<filter-class>SetCharacterEncodingFilter</filter-class>

<init-param>

<param-name>encoding</param-name>

<param-value>gb2312</param-value>

</init-param>

</filter>

<filter-mapping>

<filter-name>SetCharacterEncodingFilter</filter-name>

<url-pattern>/*</url-pattern>

</filter-mapping>
 

 

 

修改後的process.jsp代碼如下:

 

<%@ page contentType="text/html; charset=gb2312"%>

<html>

<head>

<title>JSP的中文處理</title>

</head>

<body>

<%=request.getParameter("name")%>

</body>

</html>
 

 

以上方法只對POST方式提交有效果。

Ø GET提交方式

如果使用get方式提交中文,接受參數的頁面也會出現亂碼,這個亂碼的原因也是tomcat的內部編碼格式iso8859-1導致。Tomcat會以get的缺省編碼方式iso8859-1對漢字進行編碼,編碼後追加到url,導致接受頁面得到的參數爲亂碼。

解決辦法:

A 使用POST提交方式解決辦法的第一種方式,對接受到的字符進行解碼,再轉碼。

B 、首先配置tomcatserver.xmlConnector節點增加useBodyEncodingForURI="true"屬性配置,然後在JSP頁面中加入<%request.seCharacterEncoding("gb2312");%>所設置的編碼格式進行編碼。

1Tomcatserver.xml配置如下:

 

<Connector port="8080" protocol="HTTP/1.1" 

connectionTimeout
="20000"

redirectPort
="8443"

useBodyEncodingForURI
="true"

/>

 

  

 

2、修改後的process.jsp代碼如下:

 

<%@ page contentType="text/html; charset=gb2312"%>

<%request.seCharacterEncoding("gb2312");%>

<html>

<head>

<title>JSP的中文處理</title>

<meta http-equiv="Content-Type" content="text/html; charset=gb2312">

</head>

<body>

<%=request.getParameter("name")%>

</body>

</html>
 

 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章