搜索

分享

QQ空间 QQ好友新浪微博微信

爬虫基础1

满屋书香 2022-05-11 发布于湖北省

展开全文

1、爬虫：Web Crawler

是按照一定规则抓取网页信息的程序。

爬虫获取的就是浏览器解析之前的源代码

自动，获取，提取，保存信息。

2、Url:链接

规则：http+：+//+主机名+/

HTTP:超文本传输协议

HTTPS:超文本传输安全协议

3、请求和响应

请求：对什么做什么 Request Headers

响应：执行结果和数据Response headers

4:状态码

5、爬虫注意事项

基本规则--robots协议

道德准则

法律风险

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：满屋书香 > 《python学习》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

满屋书香

关注对话

TA的最新馆藏

[转] 重型商用车电子电气架构的规划（欧曼）
爬虫第4课
爬虫第3课
爬虫第2课
爬虫基础1
学习笔记30-28

喜欢该文的人也喜欢更多

热门阅读换一换