分享

servlet规范要求:request的缺省编码必须是iso-8859-1

 vchengyun 2007-04-03
web学习吧 2006-12-19

看到很多文章在问和答关于java网页汉字乱码的情况,有些甚至认为这是servlet包容器实现上的错误。
可是如果读过servlet规格说明书,关于java网页编码的问题就应该迎刃而解了。

编写java网页(servlet\jsp),需要关心response(反馈给客户端的页面)和request(来自客户端的数据)的编码问题。

response的编码可以直接用代码实现。而request的编码怎么办呢?
以下是servlet规范书上的文字(我粗略翻译一下吧,不怕见笑):

-- 整理自<Java Servlet Specification Version 2.3> SRV.4.9 --

当前,很多浏览器并不发送带有“Content-Type”头信息的字符编码限定符,而由读取HTTP请求的代码来决定字符的编码方式。如果客户端请求未定义编码限定符,则包容器(如tomcat)用于创建request reader和分析POST数据的request的缺省编码方式必须是“ISO-8859-1”。然而,为了向开发者指明客户端没有发送字符编码信息的情况,包容器对getCharacterEncoding方法返回null。

如果客户端不设置字符编码方式,并且request不是按照以上缺省编码方式(iso-8859-1)来编码,则会发生问题。为了解决这个问题,在接口ServletRequest中加入了一个新的方法setCharacterEncoding(String enc)。开发者可以调用这个方法来替换包容器提供的缺省字符编码方式。但是,必须在从request中分析任何POST数据或者读取任何输入之前,调用这个方法。一旦数据已被读取,则调用这个方法将不会影响编码方式。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多