1、Java内部运算中,所有涉及到的字符串处理都会被转换为UTF编码来处理,这种转换是在
Java内部进行的。相反,当Java系统向外部输出字符串的时候也会转换为其他的字符编码。
比如,输入Java系统的字符编码为GBK,但输出的字符编码为ISO-8859-1。那么在做这种
转换的时候就会出现乱码。
2、指定统一的字符集,可以选择ISO-8859-1,GBK,UTF-8。统一编码为ISO-8859-1和GBK
虽然带来编码的方便,但是各自只能在相应的语言的操作系统上运行。比如ISO-8859-1字
符集是英文操作系统默认的字符集;GBK是中文操作系统默认的字符集。有没有一种字符
集能够在不同语言平台中具有更好的兼容性呢? 有,就是将Java系统的统一编码定义为
UTF-8,UTF-8是一种兼容所有语言的编码方式!如果将Web应用的入口和出口全部设定为
UTF-8的字符集,就能杜绝中文乱码的出现。
设定Web应用出口和入口统一为UTF-8字符集的步骤如下:
1、添加过滤器,统一输入字符集编码:SetCharacterEncodingFilter.java
2、JSP头部声明,统一输出字符集编码:
<%@ page language="java" contentType="text/html; charset=UTF-8"%>
3、HTML代码声明,统一输出字符集编码:
<meta http-equiv="Content-Type"content="text/html; charset=utf-8">
4、设定数据库字符集,统一数据库读取文本字符集:
5、其他和外界交互,统一其他文本文件输入输入字符集:当应用需要读
写文件或者操作XML时,那么应该将这些文本字符集设定为UTF-8
6、服务器字符集设定:Tomcat服务器设置,修改<Connector port=“8080” URIEncoding=“UTF-8”>