分享

(ok)python3进行汉字和unicode码的转换

 hdzgx 2020-01-08

输出某个unicode码对应的汉字和某个汉字对应的unicode编码。

# -*- coding=UTF-8 -*-
str1 = "\u6000"#某个汉字的unicode码
str2=''#汉字一
#print(str1.encode('utf-8').decode('unicode_escape'))
print(str1)#输出str1对应的汉字
print(str2.encode('unicode_escape'))#输出汉字一对应的unicode编码

 其实也可以用语句:

 str1.encode('utf-8').decode('unicode_escape')

但是,当这样写时:

str1 = "\u6000"#某个汉字的unicode码
print(str1.encode('utf-8').decode('unicode_escape'))

结果为:

改成:

str1 = "\\u6000"#某个汉字的unicode码
print(str1.encode('utf-8').decode('unicode_escape'))

结果为:

结果正确。

 

 

python默认用unicode编码,所以可以直接用print输出带有'\u'的字符串,'\u'是转义字符,表示unicode编码。

当我们从txt或者从其他地方读取字符串时,如果用的'\u',当我们读进来的时候,就变成了'\\u',此时要用:

str1.encode('utf-8').decode('unicode_escape')

来进行转码,然后输出。


转载于:https://www.cnblogs.com/shixisheng/p/9255744.html


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多