技术
首页  >  技术  >  技术要闻

精确化故障定位提升网维水平

2008-07-01  来源:中国信息产业网-人民邮电报  作者:

□中国电信股份有限公司上海研究院 李莉

1.背景

随着业务的发展和网络的建设,运维部门的结构也日益复杂,每个电信公司往往都有负责交换、传输、动力、数据的多个运维团队,一旦有问题发生,客户的业务往往是跨越几层网络架构,给维护带来不便。而当前的网络运维管理系统主要依据设备类型以及专业子网不同来安排运维人员和运维工具,这种做法无论对提高整体服务水平还是对控制运行维护成本来说,都存在一些不足之处:

分散的故障管理窗口,很难实现各专业网统一的故障管理流程。也正是由于没有跨各专业子网的故障信息管理手段,对于跨专业网的故障根源的定位造成了很大困难。

告警数量很多,网络事件信息量大,很难在快速滚动的故障信息显示中,捕捉到不重复的、关键的、根源的故障信息。

故障管理无法与业务信息和其他的网络配置信息、客户信息关联,很难确定设备的故障信息对客户以及业务的影响,对客户的响应慢。

传统的电信网络以专业网络为基础,均有独立的故障上报、分类、定位和管理系统。但是同一网元失效引起的故障,往往从多个维度、多个层面同时反映出来,造成大量的重复报警和冗余报警。同时掩盖故障真正根源,很难迅速定位故障。

2.业务和网络融合的二维故障管理系统

要解决上述问题,可基于业务和网络的融合构建二维故障管理系统,来精确化定位故障,解决关联故障。

电信网络体系结构虽然复杂多样,但有明确的模块和层次划分。从电信专业角度划分,最底层是基础传送网,在基础传送网之上是承载网,例如PSTN/信令网、宽带多媒体网和DDN网等,承载网之上则是业务网,例如智能网、MPLSVPN网等。此外对基础传送网和承载网起支撑作用的支撑层包括了动力电源、管理系统和同步网,这种层次结构彼此有承载关系。

根据业务层次体系架构,业务维度体系架构从上往下依次是:具体业务、业务层、承载层、传送层以及支撑层。其中,具体业务又可以水平划分为电话业务、智能网业务、软交换业务、3G业务、MPLSVPN业务、上网业务、2M/34M/45M/155M/622M专线、增值业务、ATM/FR业务和DDN业务等。

具体业务

业务层

承载层

传送层

支撑层

图1 业务维度

网络维度以专业为主,把同专业中不同的子专业又分成大类中的小类,网络维度分为专业、子专业、故障所属层面和具体故障等字段,如图2所示。故障所属网络层面是指该故障是发生在网络的哪个层面。

专业

子专业

故障所属层面

具体故障

图2 网络维度

3.精确化故障定位

为了提高故障定位的精度,需要对相同的、重复的故障进行冗余消除,并合并同类、关联故障。进行故障冗余消除的关键是根据业务层次体系架构,参考网络拓扑关系,从业务和专业的二维角度发现多个故障之间的相关性。

网络拓扑建立好之后,需根据网络建成时形成的网络拓扑关系,为每个业务维度层及其所涉及的下层设备和链路建立关联拓扑数据库,并为所属设备和链路标注网元编号;通过故障的网元编号,在关联拓扑数据库中分析查询该网元的上下文关系,并据此对故障进行去冗余处理。

当网元发生故障时,先将其上报的故障按业务维度体系架构填入所在层面,然后根据专业维度体系架构补充故障的专业、子专业、故障所属层面以及具体故障等,根据业务层次体系架构,判断该故障是否处于业务维度的最底层,如果不是最底层,则需要查找下一层是否有故障,如果有故障,则该两个故障是同类故障,进行合并,继续往下查找,直到最底层,如果已经到达最底层,则将上述故障转为正式故障,保存在故障管理数据库中,并在关联拓扑数据库中相应位置建立故障标签。

4.应用举例

例如:故障1为一干某IP网设备故障,故障2为一干某WDM传送网设备故障。现有的故障上报和处理系统,仅仅基于本专业内部进行处理。无法结合网络拓扑也无法理解网络业务构建的关联关系,因此比较低效。例如,由传输网络某设备故障引发的数据链路中断,在传输网络中形成故障单,当数据网络链路中断,通过网管故障上报,形成数据网络故障单,而上述两个故障单无法实现故障关联。

应用业务和网络融合的方法,根据业务层次体系架构,可以知道IP网对应承载层,WDM对应传送层。

故障1的故障单表现形式为:

具体业务
业务层
数据网-IP网-一干某路由器设备故障
传送层
支撑层

故障2的故障单表现形式为:

具体业务
业务层
承载层
传输网-WDM-一干某设备故障
支撑层

如果故障1和故障2是关联故障,则新的故障单表现形式为:

具体业务
业务层
数据网-IP网-一干某路由器设备故障
传输网-WDM-一干某设备故障
支撑层

相比现有的故障上报和处理系统,利用二维故障管理系统综合网络拓扑关系以及业务体系架构的特点,从业务和网络的二维角度将多个故障有效关联。通过集中故障管理、二维故障关联,结合网络拓扑结构,将单一故障信息放到二维系统中分析,从而实现故障的高效管理、精确定位和分析。

【相关栏目】

专家文萃

关键词:故障 业务 网络 专业 关联 维度 数据 业务层 具体 体系架构 故障管理 传送 设备故障 定位 二维 层面 支撑层 一干某 网络拓扑 关系 故障单 根据 最底层 运维 以及 网元 进行 管理 故障信息 多个 电信 子专业 信息...

相关新闻