屏蔽特殊的字符、比如如果url里面的空格!url里面是不允许出现空格的。 原文连接:https://www.douban.com/note/209548348/ url编码具有十分强大的功能,以及具有十分简捷的运用技巧,那么如果在Python中文转换url编码你对其有所了解吗?以下是文章的相关内容的介绍,希望你浏览以下的文章会有所收获。 今天修改一个天气预报的东西,但输入城市不能得到天气预报,感觉是编码不对,因为你输入一个城市(比如'杭州’),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里我们就用到了模块urllib。 >>> import urllib >>> data = '杭州' >>> print data 杭州 >>> data '\xe6\x9d\xad\xe5\xb7\x9e' >>> urllib.quote(data) '%E6%9D%AD%E5%B7%9E' 那我们想转回去呢? >>> urllib.unquote('%E6%9D%AD%E5%B7%9E') '\xe6\x9d\xad\xe5\xb7\x9e' >>> print urllib.unquote('%E6%9D%AD%E5%B7%9E') 杭州细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk,其他的一般网站比如google就是utf8的。所以可以用下列语句实现。 >>> import sys,urllib >>> s = '杭州' >>> urllib.quote(s.decode(sys.stdin.encoding) .encode('gbk')) %BA%BC%D6%DD >>> urllib.quote(s.decode(sys.stdin.encoding) .encode('utf8')) '%E6%9D%AD%E5%B7%9E' 以上的相关内容就是对Python中文转换url编码的详细介绍。 |
|