Python学习 - 沧海一粟 - Web系统架构与服务器运维,php开发

Python学习

Python标准库之urllib，urllib2自定义Opener

jed , 2017-6-22 14:42 , Python学习 , 评论(0) , 阅读(75311) , Via 本站原创

urllib2.urlopen()函数不支持验证、cookie或者其它HTTP高级功能。要支持这些功能，必须使用build_opener()函数创建自定义Opener对象。

1. build_opener([handler1 [ handler2, ... ]])

参数handler是Handler实例，常用的有HTTPBasicAuthHandler、HTTPCookieProcessor、ProxyHandler等。

build_opener ()返回的对象具有open()方法，与urlopen()函数的功能相同。

阅读全文

python3中的urlopen对于中文url的处理

jed , 2017-6-22 14:24 , Python学习 , 评论(0) , 阅读(61533) , Via 本站原创

urllib.request.urlopen('http://www.sina.com.cn'),如果url中有中文怎么办，Python3不是默认采用utf-8编码的吗？但是还是出现了如下错误

UnicodeEncodeError: 'ascii' codec can't encode characters in position 78-89: ordinal not in range(128)

主要是由于url中带有中文导致的。

刚刚看了urllib.parse.quote()的定义，完全可以直接处理中英混排的url，无需单独处理中文再拼接。具体方法：

# -*- coding:utf-8 -*-

from urllib.parse import quote

url = 'http://www.example.com/api.php?text=中文在这里'

# 不带附加参数

print('\n不带附加参数：\n%s' % quote(url))

# 附带不转换字符参数

print('\n附加不转换字符参数：\n%s' % quote(url, safe='/:?='))

运行结果：不带附加参数：

http%3A//www.example.com/api.php%3Ftext%3D%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

附加不转换字符参数：

http://www.example.com/api.php?text=%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

quote可用的参数如下：

quote(string, safe='/', encoding=None, errors=None)

其中的safe参数可用的范围：

reserved = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","

这样对于爬取来的混合中文的url可以直接处理了。

分页： 1/1

[ 显示模式：摘要 | 列表 ]

< 2025 > < 7 >
日	一	二	三	四	五	六
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

沧海一粟

Python标准库之urllib，urllib2自定义Opener

python3中的urlopen对于中文url的处理

公告

分类

日历

赞助商链接

在线音乐

邮箱登陆

最新日志

热门文章

最新评论

归档

热门Tags

链接

统计

其他

选择模板

赞助商广告


用户名：
密码：