分享

页面乱码问题根源浅析

 sailorhzr 2014-12-15

这个问题已经遇到过俩次了,就是页面中明确指明了编码是UTF8,但是显示是乱码。

虽然知道解决方法,也知道是Apache的原因,但是一直没有去找其所以然,今天趁机,就研究了一下。

首先, 关闭PHP配置文件php.ini中的default_charset:

1. 页面没有指定charset , Apache配置defaultcharst gbk , 页面文件编码是utf-8

结果: 乱码,使用wireshark抓包,发现服务器返回的header中指明了:

  1. Content-Type:text/html;charset=GBK  

结论:当页面没有指明charset的时候,Apache的defaultcharset起作用

2. 页面指定charset为utf-8, Apache配置defaultcharset gbk. 页面文件是utf-8

  1. <head>  
  2.         <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />  
  3. </head>  
  4. <body>  
  5.         <div id="page-header">  
  6.          测试Apache DefaultCharset  
  7.         </div>  
  8. </body>  
  9. </html>  

结果还是出现乱码。

结论:当Apache配置了DefaultCharset, 将忽略页面的charset申明。

3. PHP header申明charset为utf8, Apache配置defaultcharst gbk,页面文件编码是utf8

  1. header("Content-Type:text/html; charset=utf-8");  

结果 : 页面显示正常。

4 Apache设置DefaultCharset off

结果,页面显示正常。

翻阅了下Apache2的手册:

  1. AddDefaultCharset指令  
  2. 说明当应答内容是text/plain或text/html时,在HTTP应答头中加入的默认字符集  
  3. 语法AddDefaultCharsetOn|Off|charset  
  4. 默认值AddDefaultCharsetOff  
  5. 作用域serverconfig,virtualhost,directory,.htaccess  
  6. 覆盖项FileInfo  
  7. 状态核心(C)  
  8. 模块core  
  9.    
  10. 当且仅当应答内容是text/plain或text/html时,此指令将会在HTTP应答头中加入的  
  11. 默认字符集。理论上这将覆盖在文档体中通过<meta>标 签指定的字符集,但是实际  
  12. 的行为通常取决于用户浏览器的设置。AddDefaultCharsetOff将会禁用此功能。   
  13.    
  14. AddDefaultCharsetOn将启用Apache内部的默认字符集iso-8859-1。您  
  15. 也可以指定使用在IANA注册过的字符集名字 中的另外一个charset。  
  16. 比如说:  
  17. AddDefaultCharsetutf-8  

也就是说,当Apache不指定defaultcharset的时候,页面编码由页面自己的meta标签指定。

当Apache指定的时候,将忽略页面中的meta标签指定的编码. 但是容许脚本直接header编码方式给客户端

最后,还有一个问题没有得出结果:

当Apache和页面都没有指定的时候, 又如何?

我在自己的机器上,如果都不指定, 默认还是utf8.


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多