多语言展示
当前在线:780今日阅读:75今日分享:44

解决负载均衡设备故障:[1]解决四层设备故障

负载均衡设备是个很怪的网络设备,非常流行,但老会出妖蛾子。
工具/原料
1

抓包工具

2

shell角本

方法/步骤
1

应用人员反映有用户投诉网站偶尔有连不上的情况,但不是必现,QA也未能重现,需要系统同学协助

2

采用普通故障处理流程,用ping测试,但无效果,ping数万个包,无论大包还是小包,全是正常

3

作非常规手段,写角本测试,角本内容主要是探测80 http端口是否有响应,连续进行循环测试,一天下来确认故障,由于中间过了很多设备,也不排除是应用无响应

4

只好用笨办法,把流量抓下来分析,还好这种恶心的故障不是时时有,结合上一个测试的时间点来对错误

5

然后就是在有http不响应的时间点,分析抓包了,发起端和服务器端全部要分析,可以看到客户端是发起请求了,然后超时

6

然后就是服务端了,服务端明显就没收到过这个请求,那就是这个包被丢了呗,由于网络结构比较简单,接入交换机---负载均衡----测试端,接入排查没问题,那异常就在负载均衡了。结果呢厂家说这个设备性能不够了,还发明了一个瞬时包数过大的新词汇。。

注意事项

用监控软件,把频率开至最高,监控WEB也能发现

推荐信息