分享

Python中文转换url编码的实际操作步骤介绍

 O听_海_轩O 2020-07-08

屏蔽特殊的字符、比如如果url里面的空格!url里面是不允许出现空格的。

在 Python2.x 中的用法是:
urllib.quote(text)
Python3.x 中是
urllib.parse.quote(text)
按照标准, URL 只允许一部分 ASCII 字符(数字字母和部分符号),其他的字符(如汉字)是不符合 URL 标准的。
所以 URL 中使用其他字符就需要进行 URL 编码。

URL 中传参数的部分(query String),格式是:
name1=value1&name2=value2&name3=value3
假如你的 name 或者 value 值中有『&』或者『=』等符号,就当然会有问题。所以URL中的参数字符串也需要把『&=』等符号进行编码。

URL编码的方式是把需要编码的字符转化为 %xx 的形式。通常 URL 编码是基于 UTF-8 的(当然这和浏览器平台有关)。
例子:
比如『我』,unicode 为 0x6211, UTF-8 编码为 0xE6 0x88 0x91,URL 编码就是
%E6%88%91
在 JavaScript 中,提供了 encodeURI 和 encodeURIComponent 两种方法对 URL 进行编码;
Python 的 urllib 库中提供了 quote 和 quote_plus 两种方法。
因为是针对不同场景设计,以上四种方法编码的范围均不相同,比如 quote 除了 -._/09AZaz ,都会进行编码。quote_plus 比 quote 『更进』一些,它还会编码 /



原文连接:https://www.douban.com/note/209548348/


url编码具有十分强大的功能,以及具有十分简捷的运用技巧,那么如果在Python中文转换url编码你对其有所了解吗?以下是文章的相关内容的介绍,希望你浏览以下的文章会有所收获。


今天修改一个天气预报的东西,但输入城市不能得到天气预报,感觉是编码不对,因为你输入一个城市(比如'杭州’),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里我们就用到了模块urllib。

>>> import urllib
>>> data = '杭州'
>>> print data
杭州

>>> data
'\xe6\x9d\xad\xe5\xb7\x9e'
>>> urllib.quote(data)
'%E6%9D%AD%E5%B7%9E'
那我们想转回去呢?

>>> urllib.unquote('%E6%9D%AD%E5%B7%9E')
'\xe6\x9d\xad\xe5\xb7\x9e'
>>> print urllib.unquote('%E6%9D%AD%E5%B7%9E')
杭州细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk,其他的一般网站比如google就是utf8的。所以可以用下列语句实现。

>>> import sys,urllib
>>> s = '杭州'
>>> urllib.quote(s.decode(sys.stdin.encoding)
.encode('gbk'))
%BA%BC%D6%DD
>>> urllib.quote(s.decode(sys.stdin.encoding)
.encode('utf8'))
'%E6%9D%AD%E5%B7%9E'
以上的相关内容就是对Python中文转换url编码的详细介绍。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多