分享

Python3 字符串前面加u,r,b的含义

 hdzgx 2019-12-27

u/U:表示unicode字符串

不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。
一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。 建议所有编码方式采用utf8。在python3中,字符串默认创建即以Unicode编码存储,可以存储中文。

例子一:
u"我是含有中文字符组成的字符串。"

作用:
后面字符串以 Unicode 格式 进行编码,一般用在中文字符串前面,防止因为源码储存格式问题,导致再次使用时出现乱码。

例子二:
string = 'a' 等效于 string = u'a'

Unicode中通常每个字符由2个字节表示。
u'a' 即 u'\u0061' 实际内存中为 [0000 0000] [0110 0001]


r/R:表示非转义的原始字符串。

与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的”\n”表示换行,”\t”表示Tab等。而如果是以r开头,那么说明后面的字符,都是普通的字符了,即如果是“\n”那么表示一个反斜杠字符,一个字母n,而不是表示换行了。
以r开头的字符,常用于正则表达式,对应着re模块。
例:r"\n\n\n\n”  # 表示一个普通生字符串 \n\n\n\n,而不表示换行了。

作用:
去掉反斜杠的转移机制。(特殊字符:即那些,反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的”\n”表示换行,”\t”表示Tab等。 )

应用:
常用于正则表达式,对应着re模块。


b:表示bytes类型字符串

python3.x里,默认的str是(py2.x里的)unicode,bytes是(py2.x)的str,b”“前缀代表的就是bytes。
python2.x里,b前缀没什么具体意义, 只是为了兼容python3.x的这种写法。

例子一:

response = b'<h1>Hello World!</h1>'     # b' ' 表示这是一个 bytes 对象

作用:
b" "前缀表示:后面字符串是bytes 类型。

用处:
网络编程中,服务器和浏览器只认bytes 类型数据。如:send 函数的参数和 recv 函数的返回值都是 bytes 类型。

例子二:
字符串存储为Ascll码,无法存储中文。

result = b'你好20190101'

编译会报如下错误:
SyntaxError: bytes can only contain ASCII literal characters.

每个字符由1个字节表示(8位)
b'a'即b'\x61' 实际内存中位 [0110 0001]

附:
在 Python3 中,bytes 和 str 的互相转换方式是
str.encode('utf-8')
bytes.decode('utf-8')


print(r'A\tA')        结果为A\tA
print(b'A\tA')         结果为b'A\tA'
print(u'A\tA')         结果为A     A

注意:b'A\tA' 打印结果中自带一个b'',表示该字符串是一个字节数组。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多