分享

Python内部编码转换

 snailzen 2018-07-13
一、编码转换 
Python内部的字符串一般都是 Unicode编码。 
1. 代码中字符串的默认编码与代码文件本身的编码是一致的。 
2. 所以要做一些编码转换通常是要以Unicode作为中间编码进行转换的,即先将其他编码的字符串解码(decode)成 Unicode,再从 Unicode编码(encode)成另一种编码。Gbk存储的字符->decode(“GBK”)->unicode->encode(“utf-8”)



 decode 的作用是将其他编码的字符串转换成 Unicode 编码 
例如:name.decode(“GB2312”),表示将GB2312编码的字符串name转换成Unicode编码 
 encode 的作用是将Unicode编码转换成其他编码的字符串 
例如: name.encode(”GB2312“),表示将unicode字符串name转换成GB2312编码 
进行编码转换的时候必须先知道 name 是那种编码,然后 decode 成Unicode 编码,最后再 encode 成需要编码 
name 已经就是 Unicode 编码了,那么就不需要进行 decode 进行解码转换了,直接用 encode 就可以编码成你所需要的编码

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多