UTF-8、iso-8859-1、GBK以及
?
?
在解决TOMCAT中文乱码问题时,总是牵扯到UTF-8、iso-8859-1、GBK之间的转换做小结如下:
1.UTF-8和GBK之间可以互相转换,并且UTF-8大于GBK,可以简单理解为GBK是UTF-8的子集。
2.UTF-8和iso-8859-1之间的转换:iso-8859-1可以转成UTF-8,但是UTF-8不能转换成iso-8859-1,原因很简单,你可以简单理解为强制类型转换,把一个高精度的类型转成低精度的,会造成数据丢失!其实,真实原因是UTF-8编码的中文字符在iso-8859-1编码表中没有匹配的位置。另外,iso-8859-1也可以写成ISO8859_1。
3.GBK和iso-8859-1之间的转换:道理同UTF-8和iso-8859-1之间转换一样,不再赘述!
4.凡是能用GBK解码方式的,同样也能用UTF-8解码方式。所以,保险起见,强烈推荐JSP,XML中统一使用UTF-8字符集。然后统一使用UTF-8解码,这样中英文都能正常显示,也符合国际化的思想。