分享

正则 /gi 贪婪模式 \ 反斜杠

 一本正经地胡闹 2019-10-10

/i    忽略大小写的功能,是不能单独使用的。

/g    在全文中查找所出现的指定字符串。    

/ig    忽略大小写在全文中查找指定字符串。

/gi    /gi和/ig作用是一样的,都是忽略大小写在全文中查找指定字符串。

/m    多行查找

正则表达式的通项: /pattern/flags 即(/模式/标记 )

构造器函数方法使用方法如下:

new RegExp("pattern"[, "flags"])(即new RegExp("模式"[,"标记"]))

pattern(模式)表示正则表达式的文本 

flags(标记):如果指定此项,flags可以是下面值之一:

g: global match(全定匹配)i: ignore case(忽略大小写)gi: both global match and ignore case(匹配所有可能的值,也忽略大小写)

表达式建立同样的正则表达式例如:

/ab+c/gi

扩展资料:

正则表达式:以字符串的形式规定一个规则,在文本中匹配并找出符合的字符串。

re库中常用的六个函数分别是match、compile、sub、split、search、findall,这些函数的用法基本都是相同的,只是目的不一样。

re.method(pattern, string)

pattern:正则表达式

string:文本

意义:从string文本里以pattern这个规则匹配对应的字符串

re.compile

提前预编译好一个正则,后续可直接调用其他正则库中的函数

re.split

以正则表达式为分隔符,对文本进行分隔,返回由分隔后的所有字符组成的列表

re.findall  

返回字符串中所有正确匹配项组成的列表,即列表中每个元素都能跟正则表达式匹配

re.sub(a,b,c)

将字符串c中符合正则表达式a的字符全换成字符b,并返回

\s匹配任意的空白符(包括空格,制表符(Tab),换行符,中文全角空格
\S则是任意不是空白符的字符

?涉及到贪婪模式
当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。以这个表达式为例:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。

有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:

a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab(第一到第三个字符)和ab(第四到第五个字符)

表达式 .* 就是单个字符匹配任意次,即贪婪匹配。 表达式 .*? 是满足条件的情况只匹配一次,即最小匹配.

\s    匹配任何空白非打印字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意 Unicode 正则表达式会匹配全角空格符。   

\S    匹配任何非空白非打印字符。等价于 [^ \f\n\r\t\v]。    

*限定符是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。

比如:<H1>Chapter 1 - 介绍正则表达式</H1>

使用/<.*>/匹配的结果为:H1>Chapter 1 - 介绍正则表达式</H1。

使用/<.*?>/匹配结果为:H1。

拓展知识

正则表达式特殊字符及其含义

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多