分享

urllib.request的常用函数

 郭祺迦 2018-09-17
第一个:

urllib.request.urlopen()#需要传递一个url;获得的是一个对象

对象名.read():得到的是二进制数据

二进制-->字符串:decode()

字符串-->二进制:encode()

在网上碰到的编码格式只有 gbk 和 utf8


其他的方法:
对象名.readlines():按行读取
对象名.url:获取请求的网址

对象名.headers:获取响应头部,字符串格式的

对象名.getheaders():列表  列表里面是元组

对象名.getcode():获取响应的状态码

举例:
url = 'http://www.baidu.com/'
res = urllib.request.urlopen(url)#打开该url  获取一个对象

print(res.read().decode("utf8"))#读取该对象的内容,以字符串的格式读取

#将响应的信息保存到文件中
with open('baidu.html','wb') as fp:
fp.write(res.read())

第二个:

urllib.request.urlretrieve()

urllib.request.urlretrieve(url,filepath)#将获取的URL的内容写到文件目录中去

举例:

图片的下载

#普通的下载
img_url = "http://i1./uploads/tu/201807/9999/89162d0319.jpg"

urllib.request.urlretrieve(img_url,'baidu.jpg')#通过url获取到该图片,并且存储到baidu.jpg

#一般图片都有防盗链,如果有防盗链的话需要使用下面的方式

img_url = "http://i1./uploads/tu/201807/9999/89162d0319.jpg"
res = urllib.request.urlopen(img_url)

#存储文件
with open('qizhi.jpg','wb') as fp:

fp.write(res.read())

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多