各位客官姥爷好,欢迎回来。我们上次聊到如何在EXCEL中定义正则表达式函数,那么这个正则表达式到底是什么呢?我们这次就来细聊。(文末附有小测验,欢迎大家尝试) 定义 正则表达式(Regular Expression,通常简写为Regex或RE),又称规则表达式。 正则表达式是对字符串进行过滤的一种公式,主要由具有特定意义的字符组成。我们一般把这种特定意义的字符称为元字符。正则表达式通常被用来检索或替换符合某个规则的文本。 那么常见的元字符有哪些呢? 元字符 在我这里把常见的元字符归为以下几组: 第一组:格式组(匹配换行、回车等格式类符号)
比如替换掉下面中的换行符: 第二组:叫板组(你说A,我就偏不说A)
当然他们之间也可以组合起来,比如其中的\s和\S组合起来:[\s\S],就是匹配所有字符,其他组类似。 第三组:限定组(限定匹配的次数)
比如匹配4个数字: 第四组:位置组(表示符号的位置)
比如匹配以0结尾的数据: 第五组:断言组(假设满足一定的条件)
比如匹配abc的所有字符: 第六组:子表达式及其他组(和子表达式相关的,以及其他常用的元字符)
由于.在叫板组中表示匹配除换行符以外的任意字符,但是如果我们就想匹配.这个符号时,就需要用到\这个转义字符,即\.表示匹配.这个符号。 比如删除下面字符中的重复项: 小测验 在EXCEL中使用正则表达式对字符串:“单芯片,双芯片,单芯片,双芯片,四芯片,单芯片”进行删除重复项。 结果可能为:“双芯片,四芯片,单芯片”。PS:对结果的前后顺序不做要求。 (如果您还不知道EXCEL中如何定义正则表达式函数,请点这里) |
|