python中使用 re模块实现对正则表达式的使用方式实现方式包括 2种 1 re是一个引用模块,类似与其他的模块的使用,可以直接进行调取模块中的功能函数使用。 例如:
得到的结果:
split语法: 此处使用的是第二种语法结构:re.split(pattern, string[, maxsplit]) 说明:pattern 匹配的正则表达式 正则表达式中r 表示的是Python 代码中的 Raw 字符串,在字符串前加个 “r” 反斜杠就不会被任何特殊方式处理,所以 r”\n” 就是包含”\” 和 “n” 的两个字符,而 “\n” 则是一个字符,表示一个换行。 如何使用第一种语法? 2 使用compile 函数生成一个正则表达式对象。该对象能够通过一些方法(函数)进行正则表示式处理操作。 具体流程可类似如下所示(来源于网上,当然含包括除匹配之外的类似搜索,替换等处理): 因此对于 1 中的实例,还可以通过一下方法进行实现:
第一行是将正则表达式编译为Pattern对象 所以,在使用python的正则表达式时,可以采取以上任意一种方法。当然,第二种方式可以重复使用,灵活性大。 说明:由于此处只介绍python正则表达式的使用思路,所以更多有关的,具体的语法,语句可以参考相关材料。 python简单爬虫实现此处简单实现爬虫实例,主要简述思路:包括,抓取网页,数据获取。
此源码来源 http://www.cnblogs.com/fnng/p/3576154.html 分别使用到获取url的库urllib以及正则表达式模块。正则表达式使用的是第二种语法结构。 说明: 以上使用的是python2.7。
上述程序中的urllib应该改为
(现在有更高版本的urllib,进一步简化了程序语句) 以上程序抓取的结果是一些图片的链接。 |
|
来自: 二楼202 > 《python学习》