urllib.request的常用函数

郭祺迦 2018-09-17

展开全文

第一个：

urllib.request.urlopen()#需要传递一个url；获得的是一个对象

对象名.read()：得到的是二进制数据

二进制-->字符串：decode()

字符串-->二进制：encode()

在网上碰到的编码格式只有 gbk 和 utf8

其他的方法：

对象名.readlines():按行读取

对象名.url:获取请求的网址

对象名.headers:获取响应头部，字符串格式的

对象名.getheaders():列表列表里面是元组

对象名.getcode():获取响应的状态码

举例：

url = 'http://www.baidu.com/'

res = urllib.request.urlopen(url)#打开该url 获取一个对象

print(res.read().decode("utf8"))#读取该对象的内容，以字符串的格式读取

#将响应的信息保存到文件中

with open('baidu.html','wb') as fp:

fp.write(res.read())

第二个：

urllib.request.urlretrieve()

urllib.request.urlretrieve(url,filepath)#将获取的URL的内容写到文件目录中去

举例：

图片的下载

#普通的下载

img_url = "http://i1./uploads/tu/201807/9999/89162d0319.jpg"

urllib.request.urlretrieve(img_url,'baidu.jpg')#通过url获取到该图片，并且存储到baidu.jpg

#一般图片都有防盗链，如果有防盗链的话需要使用下面的方式

img_url = "http://i1./uploads/tu/201807/9999/89162d0319.jpg"

res = urllib.request.urlopen(img_url)

#存储文件

with open('qizhi.jpg','wb') as fp:

fp.write(res.read())

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：郭祺迦 > 《urllib库》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多