分享

python 正则表达式使用

 远方 2018-12-27

正则表达式总结:

python支持的字符和语法:
. 匹配任意除换行符\n 之外的所有字符
\ 转义字符 比如说要匹配的字符中含有 \ . * 等可以使用\转义 例如 \* \. \\
[.....] 直接写要匹配的字符串 例如a[bcd]e
\d 匹配数字
\D 非数字
\s 空白字符 例如:空格 \n \r \t。。。
\S 飞空白字符
\w 匹配字母或数字或下划线或汉字
\W 匹配任意不是字母,数字,下划线,汉字的字符
^ 匹配字符串的开始
$ 匹配字符串的结束
[^x] 匹配除了x以外的任意字符

常用的限定符:
* 重复0次或跟多次 也就是大于等于0
+ 重复1次或跟多次 也就是大于等于1
? 重复0次或一次
{n} 重复n次
{n,} 重复n或更多次
{n,m} 重复n到m次
懒惰限定符:
.*? 代表除了换行符之外匹配到的最少次数 相当于只匹配一次吧。。
*?重复任意次但经可能少重复
+?重复一次或跟多次 尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复

例子:

#-*-coding:utf-8-*-
#author:wangxing
#descr:re
import re
s1 = '345admin1234yyy'
s2 = 'admin12341.222'
s3 = 'adminstratior'

result = re.match('\D+',s2) #match只能够找到字符串的开头匹配到的第一个,result是一个对象
if result:
print result.group()
else:
print 'Nothing'

result1 = re.search('\d+',s3) #search 匹配字符串所有内容的第一个匹配到的,resul1是一个对象
if result1:
print result1.group() #group用于显示匹配到的字符
else:
print 'Also Nothing '

#compile 类似于python文件编译后卫pyc格式,这里是编译后为一个变量,好处是再次执行速度快

com = re.compile('\d+') #compile编译的意思
print com.findall(s2) #findall是查找到字符串中所有符合条件的内容展示到一个列表中
print com.split('admin1www3xing4') #按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数,不指定将全部分割。

com1 = re.search(r'(\w+)\d+(\w+)',s2)
print com1.groups() #groups 只匹配分组的也就是()里面的
print com1.group() #group 匹配所有表达式匹配到的

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约