分享

正则表达式,这篇看完就够了

 网摘文苑 2023-02-22 发布于新疆

正则表达式是一种用于匹配文本模式的工具,它能够帮助我们在处理文本时更加高效地进行搜索、替换和验证操作。在本篇文章中,我将通过通俗易懂的语言让正则表达式不再苦涩难懂。

基本规则

在正则表达式中,除了基本的字符匹配规则、字符类和量词外,还有一些特殊的符号和元字符,它们在正则表达式中具有特殊的含义和作用。以下是一些常见的正则表达式符号和元字符的说明:

  • /:正则表达式的开始和结束符号。
  • ^:表示匹配文本的开头。例如,/^abc/ 表示匹配以 'abc' 开头的文本。
  • $:表示匹配文本的结尾。例如,/abc$/ 表示匹配以 'abc' 结尾的文本。
  • .:匹配任意单个字符,不包括换行符。例如,/a.c/ 表示匹配以 'a' 开头,'c' 结尾,中间有任意一个字符的文本。
  • |:表示或,可以用于匹配多个表达式中的任意一个。例如,/abc|def/ 表示匹配 'abc' 或 'def'。
  • []:表示字符集,用于匹配一组字符中的任意一个。例如,/[abc]/ 表示匹配字母 'a'、'b' 或 'c' 中的任意一个。
  • ():表示分组,可以将一部分正则表达式放在括号中,并对它们进行分组匹配。例如,/(ab)+/ 表示匹配一或多个 'ab'。
  • ?:表示可选,用于匹配前面的字符或表达式出现零次或一次。例如,/a?b/ 表示匹配零个或一个 'a',后面紧跟一个 'b'。
  • *:表示零个或多个,用于匹配前面的字符或表达式出现零次或多次。例如,/ab*c/ 表示匹配一个 'a',后面跟着零个或多个 'b',最后紧跟一个 'c'。
  • +:表示一或多个,用于匹配前面的字符或表达式出现一次或多次。例如,/ab+c/ 表示匹配一个 'a',后面跟着一个或多个 'b',最后紧跟一个 'c'。
  • {}:表示重复次数,用于指定前面的字符或表达式重复出现的次数范围。例如,/ab{2,4}c/ 表示匹配一个 'a',后面跟着两到四个 'b',最后紧跟一个 'c'。
  • \:表示转义字符,用于将特殊字符转义为普通字符。例如,/a\./ 表示匹配一个 'a',后面跟着一个 '.'。

以上是一些常见的正则表达式符号和元字符的说明,还有一些比较重要的符号和元字符:

  • [] 中的 ^:表示不在字符集中,用于匹配不属于指定字符集中的任意字符。例如,/[^abc]/ 表示匹配除了 'a'、'b'、'c' 之外的任意字符。
  • [] 中的 -:表示字符范围,用于匹配指定范围内的任意字符。例如,/[a-z]/ 表示匹配任意小写字母。
  • () 中的 |:表示分组中的或,可以用于匹配分组中的任意一个表达式。例如,/(ab|cd)/ 表示匹配 'ab' 或 'cd'。

API

在JavaScript中,可以使用RegExp对象来创建正则表达式。以下是RegExp对象的一些常用方法:

  • test()

用于测试一个字符串是否匹配正则表达式。该方法返回一个布尔值,表示是否匹配成功。

var regex = /^[a-z]+$/; // 匹配小写字母var str1 = 'hello';var str2 = 'Hello';console.log(regex.test(str1)); // trueconsole.log(regex.test(str2)); // fals
  • exec()

exec() 方法用于在一个字符串中查找匹配的文本,并返回第一个匹配的结果。如果没有找到匹配的文本,则返回 null。

该方法返回一个数组,数组的第一个元素是匹配的文本,后面的元素是捕获分组的匹配结果。如果没有捕获分组,则数组的长度为 1。

var regex = /(\d{4})-(\d{2})-(\d{2})/; // 匹配日期格式(yyyy-mm-dd)var str = 'Today is 2023-02-19';var result = regex.exec(str);console.log(result); // ['2023-02-19', '2023', '02', '19']
  • match()

match() 方法用于在一个字符串中查找匹配的文本,并返回所有匹配的结果。该方法返回一个数组,数组中的每个元素都是匹配的文本,数组的长度就是匹配次数。

如果正则表达式中有捕获分组,则返回的数组中每个元素也会包括捕获分组的匹配结果。

var regex = /cat/g; // 匹配所有的 'cat'var str = 'The cat in the hat sat on the mat.';var result = str.match(regex);console.log(result); // ['cat', 'cat', 'cat']
  • replace()

用于在一个字符串中替换匹配的文本。该方法接受两个参数,第一个参数是要替换的文本或正则表达式,第二个参数是用于替换的新文本或函数。

如果第一个参数是正则表达式,则可以在替换文本中使用 $1、$2 等语法来引用捕获分组的匹配结果。

var regex = /world/g;var str = 'hello world';var newStr = str.replace(regex, 'JavaScript');console.log(newStr); // 'hello JavaScript'var regex2 = /(\d{4})-(\d{2})-(\d{2})/;var str2 = 'Today is 2023-02-19';var newStr2 = str2.replace(regex2, '$2/$3/$1');console.log(newStr2); // 'Today is 02/19/2023'

练习题

// 匹配以 'a' 开头,'b' 结尾的字符串var regex1 = /^a.*b$/;// 匹配以 'abc''def' 开头的字符串var regex2 = /^(abc|def).*/;// 匹配以 'a' 开头,后面跟着一个或多个 'b',最后紧跟一个 'c' 的字符串var regex3 = /^ab+c$/;// 匹配任意一个小写字母或数字的字符串var regex4 = /^[a-z0-9]+$/;// 匹配以 'http://''https://' 开头的 URLvar regex5 = /^(http|https)://.*/;// 匹配日期格式(yyyy-mm-dd)var regex6 = /^\d{4}-\d{2}-\d{2}$/;// 匹配电话号码(格式为:xxx-xxxxxxx 或 xxxxxxxxxxx)var regex7 = /^\d{3}-?\d{7}$|^\d{10}$/;// 匹配邮箱地址var regex8 = /^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$/;// 使用正则表达式进行字符串替换var str = 'hello world';var newStr = str.replace(/world/, 'JavaScript');console.log(newStr); // 'hello JavaScript'

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多