分享

【Python 第57课】 正则表达式(3)20150120057

 一利阳光故事会 2020-02-24

【Python 第57课】 正则表达式(3)

先来公布上一课习题的答案:



\bs\S*?e\b



有的同学给出的答案是"\bs.*?e\b"。测试一下就会发现,有奇怪的'sea sue'和'sweet see'混进来了。既然是单词,我们就不要空格,所以需要用"\S"而不是"."



昨天有位同学在论坛上说,用正则表达式匹配出了文件中的手机号。这样现学现用很不错。匹配的规则是"1.*?\n",在这个文件的条件下,是可行的。但这规则不够严格,且依赖于手机号结尾有换行符。今天我来讲讲其他的方法。



匹配手机号,其实就是找出一串连续的数字。更进一步,是11位,以1开头的数字。



还记得正则第1讲里提到的[]符号吗?它表示其中任意一个字符。所以要匹配数字,我们可以用

[0123456789]



由于它们是连续的字符,有一种简化的写法:[0-9]。类似的还有[a-zA-Z]的用法。



还有另一种表示数字的方法:

\d



要表示任意长度的数字,就可以用

[0-9]*

或者

\d*



但要注意的是,*表示的任意长度包括0,也就是没有数字的空字符也会被匹配出来。一个与*类似的符号+,表示的则是1个或更长。



所以要匹配出所有的数字串,应当用

[0-9]+

或者

\d+



如果要限定长度,就用{}代替+,大括号里写上你想要的长度。比如11位的数字:

\d{11}



想要再把第一位限定为1,就在前面加上1,后面去掉一位:

1\d{10}



OK. 总结一下今天提到的符号:

[0-9]

\d

+

{}



现在你可以去一个混杂着各种数据的文件里,抓出里面的手机号,或是其他你感兴趣的数字了。          

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多