python 正则表达式使用

远方 2018-12-27

展开全文

正则表达式总结：

python支持的字符和语法：
. 匹配任意除换行符\n 之外的所有字符
\ 转义字符比如说要匹配的字符中含有 \ . * 等可以使用\转义例如 \* \. \\
[.....] 直接写要匹配的字符串例如a[bcd]e
\d 匹配数字
\D 非数字
\s 空白字符例如：空格 \n \r \t。。。
\S 飞空白字符
\w 匹配字母或数字或下划线或汉字
\W 匹配任意不是字母，数字，下划线，汉字的字符
^ 匹配字符串的开始
$ 匹配字符串的结束
[^x] 匹配除了x以外的任意字符

常用的限定符：
* 重复0次或跟多次也就是大于等于0
+ 重复1次或跟多次也就是大于等于1
? 重复0次或一次
{n} 重复n次
{n,} 重复n或更多次
{n,m} 重复n到m次
懒惰限定符：
.*? 代表除了换行符之外匹配到的最少次数相当于只匹配一次吧。。
*？重复任意次但经可能少重复
+?重复一次或跟多次尽可能少重复
?? 重复0次或1次，但尽可能少重复
{n,m}? 重复n到m次，但尽可能少重复
{n,}? 重复n次以上，但尽可能少重复

例子：

#-*-coding:utf-8-*-
#author：wangxing
#descr:re
import re
s1 = '345admin1234yyy'
s2 = 'admin12341.222'
s3 = 'adminstratior'

result = re.match('\D+',s2) #match只能够找到字符串的开头匹配到的第一个，result是一个对象
if result:
print result.group()
else:
print 'Nothing'

result1 = re.search('\d+',s3) #search 匹配字符串所有内容的第一个匹配到的，resul1是一个对象
if result1:
print result1.group() #group用于显示匹配到的字符
else:
print 'Also Nothing '

#compile 类似于python文件编译后卫pyc格式，这里是编译后为一个变量，好处是再次执行速度快

com = re.compile('\d+') #compile编译的意思
print com.findall(s2) #findall是查找到字符串中所有符合条件的内容展示到一个列表中
print com.split('admin1www3xing4') #按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数，不指定将全部分割。

com1 = re.search(r'(\w+)\d+(\w+)',s2)
print com1.groups() #groups 只匹配分组的也就是（）里面的
print com1.group() #group 匹配所有表达式匹配到的