共 18 篇文章 |
|
80个Python练手项目列表。我若将死,给孩子留遗言,只留一句话:Repetition is the mother of all learning重复是学习之母。他们将来长大,学知识,技巧、爱情、事业、交流....倘若懂得行动的力量,不怕重复,不怕犯错误,那就大有希望靠近幸福了。死也想分享给你们一句话,谁说的我忘了:It''''''''s not wha... 阅162 转3 评0 公众公开 19-12-09 11:38 |
scrapy.本文主要介绍爬虫收集数据优点、爬虫原理、scrapy爬虫框架,并以新闻爬取为例,详细讲解使用scrapy爬取数据的步骤以及scrapy-redis分布式。安装完成后,拷贝一份Redis安装目录下的redis.conf到任意目录,建议保存到:/etc/redis/redis.conf 打开你的redis.conf配置文件,示例: 非Windows系统: sudo vim /etc/redis/redis.conf Master端r... 阅115 转1 评0 公众公开 19-12-06 17:23 |
阅168 转0 评0 公众公开 19-11-14 17:56 |
Python open()函数用法详解一、文件操作的流程:#1. 打开文件,得到文件句柄并赋值给一个变量#2. 通过句柄对文件进行操作#3. 关闭文件。f=open(''''''''test.txt'''''''',encoding=''''''''utf-8'''''''') ... 阅452 转0 评0 公众公开 19-11-14 13:41 |
#保存所有线程的列表threads = []#创建5个线程for i in range(5): #创建一个线程 thread = gettext(''''''''Thread-''''''''+str(i)) #将创建好的线程添加到线程列表 threads.append(thread) #启动线程 thread.start()#等待所有线程结束for t in threads: t.join()print('... 阅19 转0 评0 公众公开 19-10-17 18:05 |
r = requests.get(''''''''http://m.50zw.la'''''''',params=re_header)掌握了这些,接下来获取章节内容就非常简单了三:获取章节内容。import requestsimport osfrom bs4 import BeautifulSoupurl = ''''''''http://m.50zw.la/book_1/5.htm... 阅45 转0 评0 公众公开 19-10-17 16:15 |
''''''''''''''''''''''''网站分类函数''''''''''''''''''''''''def get_category(article):''''''''&... 阅149 转1 评0 公众公开 19-09-09 13:29 |
关于urllib、urllib2爬虫伪装的总结。# -*- coding:utf-8 -*-import urlliburl=''''''''http://www.baidu.com'''''''' #百度网址html=urllib.urlopen(url)#利用模块urllib里的urlopen方法打开网页print(dir(html)) #查看对象html的方法print(urllib.urlopen) #查看对象urllib... 阅64 转0 评0 公众公开 19-07-23 09:46 |
python实现简单爬虫以及正则表达式简述python中使用 re模块实现对正则表达式的使用方式。split语法: split(string[, maxsplit]) | re.split(pattern, string[, maxsplit]): 按照能够匹配的子串将string分割后返回列表。正则表达式中r 表示的是Python 代码中的 Raw 字符串,在字符串前加个 “r” 反斜杠就不会被任何特殊方式处理,所以 r”\n” ... 阅142 转0 评0 公众公开 19-07-18 16:22 |
如何在windows下的Python开发工具IDLE里安装其他模块?以安装Httplib2模块为例。2 解压下载的压缩包“httplib2-0.9.1.zip”到某目录下。3配置python在dos下的运行环境。(之前需要配置系统环境变量,在系统环境变量Path后添加python安装目录,例如c:\python2.7)4 dos下安装httpLib2模块。进入httplib2-0.9.1.zip的解压目录,运行python setup.... 阅113 转0 评0 公众公开 19-07-11 15:53 |