借助网络分析工具排查门户网站访问失败原因 网络故障分析

故障现象描述

1、故障现象描述

某运营商为3G用户提供访问的web portal系统,在每天业务高峰(22:30至23:30)时段都会接到大量的用户投诉:网站访问不了!在故障时间段, web服务器和各网络设备的进程、资源开销与平时相比并无异常;事后查看各设备的日志,也找不到故障的原因。

 

2、基本环境描述

用户基本网络拓扑如下图所示,3G手机用户经过无线网络后,通过3G核心网访问web portal系统,web portal系统内部由多台服务器上联到一台交换机,通过Redware做负载均衡, 再通过出口路由器和防火墙上联到3G核心网:

 

网络分析工具排查门户网站访问失败原因

 

系统管理员一直尝试通过监控服务器和网络设备本身的状态、进程和日志的手段来解决问题,但这种传统的网管方式存在以下几个难点:

 

系统结构复杂:系统管理员没有3G核心网的管理权限,而web portal系统内部需要监控的设备很多,工作量大,无法迅速定位是web portal系统内部还是3G核心网端的问题;

 

无法关联分析:不同设备的监控数据无法进行有效的关联分析,无法拿出一个整体解决方案 ;

 

缺乏故障回溯数据:各设备的日志系统内容有限,无法对故障进行回溯;

 

监控网络设备时无法获取应用信息,监控应用服务器时无法获取网络信息...完整案例http://www.colasoft.com.cn/cases-and-application/network-troubleshooting001.php

 

案例来自科来官方网站(http://www.colasoft.com.cn/

CSNA网络分析论坛(http://www.csna.cn/

欢迎关注科来软件微博、CSNA网络分析论坛微博,即可活动任务奖励。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章