python爬虫socket.timeout的使用

方法/步骤

python3在使用urllib.request.urlopen或者urlllib.request.urlretrieve时候最好设置一个超时时间，这样在长时间获取不到内容时候可以做进一步的处理，打开python开发工具IDLE，新建‘timeout.py’文件，并写代码如下:import socket

设置超时时间，以秒为单位，代码如下：socket.setdefaulttimeout(30)

导入urllib.request包，代码如下：import socket import urllib.request socket.setdefaulttimeout(30)

写一个测试脚本，把timeout时间改小，访问一个较耗时网址，具体网址就不透露了，会抛出异常，代码如下：import socket import urllib.request socket.setdefaulttimeout(0.003) s = urllib.request.urlopen('http://some') print (type(s))

F5运行代码，就会出现timeout异常

接着处理抛出的异常，代码如下：import socket import urllib.request socket.setdefaulttimeout(0.003) count = 0 try: s = urllib.request.urlopen('http://some') print (type(s)) except urllib.error.URLError : print ('%s次异常' %(count+1))

F5运行代码，捕捉到异常，可以进行处理，但是urlopen捕捉不到timeout异常，会被忽略，欢迎高手指点原因，urlretrieve可以捕捉到。一般可以设置个循环次数如果超过几次都会timeout异常，就可以选择记日志，不影响后续内容的抓取

上一篇：python爬取三种方法

下一篇：花生豆子脊骨藕汤的做法

欧尼酱

python爬虫socket.timeout的使用

如何用python写爬虫

python爬虫怎么写

Python写网络爬虫-Urllib库

python爬取三种方法

python爬虫socket.timeout的使用

怎么用python爬数据

用python爬取商品页面信息

Python爬虫：如何爬虫实现以及2大解析方法

Python爬虫--BeautifulSoup（2）

python爬虫--爬取网页数据的一般步骤

python turtle教程6

python3爬虫怎样构建请求头，怎样构建header

如何使用python语言中pandas模块randn和randint

如何使用python语言pandas模块pivot_table方法

改装一套气动避震系统要多少钱

少年白发的原因是什么

白头发越来越多的原因有哪些

怎样更好的网球截击

Johnson 8.1T的避震功能调节方式

头发变白的原因

头发变白的几种原因

哪些原因会造成白发？

长白发有哪些原因呢？

白头发是怎么出现的

三月生：年轻人长白头发的5大原因

ZTA阻尼弹簧减震器为什么能减震？

阻尼弹簧减震器（ZTA型）安装说明

【药品说明书】黄豆甙元胶囊

BE橡胶减震器主要特点与用途

购买网球拍的顾客要求换货怎么办

防范装修中11个电路问题让生活远离危险

全模组电源线路连接体验

教你如何选择网球拍

JB型低频阻尼弹簧减震器特性、主要用途