正则 /gi 贪婪模式 \ 反斜杠

一本正经地胡闹 2019-10-10

展开全文

/i 忽略大小写的功能，是不能单独使用的。

/g 在全文中查找所出现的指定字符串。

/ig 忽略大小写在全文中查找指定字符串。

/gi /gi和/ig作用是一样的，都是忽略大小写在全文中查找指定字符串。

/m 多行查找

正则表达式的通项： /pattern/flags 即(/模式/标记 )

构造器函数方法使用方法如下：

new RegExp("pattern"[, "flags"])（即new RegExp("模式"[,"标记"])）

pattern(模式)表示正则表达式的文本

flags(标记)：如果指定此项，flags可以是下面值之一：

g: global match(全定匹配)i: ignore case(忽略大小写)gi: both global match and ignore case(匹配所有可能的值，也忽略大小写)

表达式建立同样的正则表达式例如：

/ab+c/gi

扩展资料：

正则表达式：以字符串的形式规定一个规则，在文本中匹配并找出符合的字符串。

re库中常用的六个函数分别是match、compile、sub、split、search、findall，这些函数的用法基本都是相同的，只是目的不一样。

re.method(pattern, string)

pattern:正则表达式

string:文本

意义：从string文本里以pattern这个规则匹配对应的字符串

re.compile

提前预编译好一个正则，后续可直接调用其他正则库中的函数

re.split

以正则表达式为分隔符，对文本进行分隔，返回由分隔后的所有字符组成的列表

re.findall

返回字符串中所有正确匹配项组成的列表，即列表中每个元素都能跟正则表达式匹配

re.sub(a,b,c)

将字符串c中符合正则表达式a的字符全换成字符b，并返回

\s匹配任意的空白符（包括空格，制表符(Tab)，换行符，中文全角空格）
\S则是任意不是空白符的字符

?涉及到贪婪模式
当正则表达式中包含能接受重复的限定符时，通常的行为是（在使整个表达式能得到匹配的前提下）匹配尽可能多的字符。以这个表达式为例：a.*b，它将会匹配最长的以a开始，以b结束的字符串。如果用它来搜索aabab的话，它会匹配整个字符串aabab。这被称为贪婪匹配。

有时，我们更需要懒惰匹配，也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式，只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧：

a.*?b匹配最短的，以a开始，以b结束的字符串。如果把它应用于aabab的话，它会匹配aab（第一到第三个字符）和ab（第四到第五个字符）

表达式 .* 就是单个字符匹配任意次，即贪婪匹配。表达式 .*? 是满足条件的情况只匹配一次，即最小匹配.

\s 匹配任何空白非打印字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意 Unicode 正则表达式会匹配全角空格符。

\S 匹配任何非空白非打印字符。等价于 [^ \f\n\r\t\v]。

*限定符是贪婪的，因为它们会尽可能多的匹配文字，只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。

比如：<H1>Chapter 1 - 介绍正则表达式</H1>

使用/<.*>/匹配的结果为：H1>Chapter 1 - 介绍正则表达式</H1。

使用/<.*?>/匹配结果为：H1。

拓展知识

正则表达式特殊字符及其含义