多语言展示
当前在线:1066今日阅读:86今日分享:14

Python爬虫中的中文网址转译

Python不支持中文, 它是解释性语言;解析器只支持 ascii 0 - 127爬取带有中文的网址, 会报错UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-11: ordinal not in range(128)
工具/原料

python3.x

报错信息
1

执行代码

2

报错信息

3

网址里面包含了汉字ascii是没有汉字的需要进行url转译将包含汉字的网址进行转译

urllib.parse, string
1

在python3中, 用到2个转译模块: urllib.parse, string导入新的模块, 然后对网址进行转译, 这样才能正确识别

2

运行以后, 查看输出结果'嫩滑' 这个中文被进行了转译

推荐信息