中国容灾网
价值广告位

首页>容灾资讯>

中国移动的容灾系统建设

来源:通信产业报 作者:宁宁 2007-12-11 08:24:42

容灾系统的建设对于电信运营商的意义不言而喻。电信行业业务系统种类繁多,数据量巨大,而且行业自身特点决定了其对业务连续性的要求特别高。本文介绍了中国移动的容灾系统建设历程及最新动向。 中国容灾网,保护数据。

电信领域历来是各存储厂商的必争之地。作为电信运营商提供服务支撑的重要保证,系统的安全稳定运行关系甚大。因此,容灾工作的重要性日益显现出来。2003年,运营商们会有什么动向呢?

中国容灾网,独家发布。

2002年年底,中国移动在全国范围基本完成BOSS系统集中化改造。为提高BOSS系统的可靠性和可用性,在进行BOSS系统建设的时候,中国移动的有关方面就开始研究、规划和设计BOSS的容灾备份系统的有关问题了。在最近刚刚结束的中国移动通信集团公司2003年全国业务支撑工作会议上,下发给与会人员的附件之一就是《业务连续性系统技术规范》(暂名),从业务连续的角度,规范、定义和解释了业务连续性(容灾)系统从规划、建设到运行等各环节的技术细节和实施建议。

中国容灾网,保护数据。

中国移动的业务支撑体系是由两级构成的,其中集团级的系统与省BOSS的功能、作用存在比较大的差异,一级的系统目前主要承担省级和国际漫游的数据交换和账务结算功能。 中国容灾网,护航业务。

自1997年起,中国移动就开始考虑集团级的漫游计费结算系统的容灾系统建设问题。经过长期的方案论证,自2001年起,在深圳开始进行全国漫游计费结算容灾系统的建设。2002年4月,该系统投入试运行,目前深圳中心已经全面接管中国移动省际、国际漫游结算业务,而北京的系统作为容灾备份系统,配合深圳中心完成生产任务。如果深圳中心出现异常情况不能进行生产,北京中心就将实时接管,确保整个漫游结算体系不间断运行。 中国容灾网,独家发布。

当集团级容灾系统建设完成以后,下面就要进行省级BOSS容灾系统的建设了。有人认为北京和深圳距离近3000公里,这样远距离的容灾系统都建成了,省级BOSS容灾系统的技术实现更应该是小菜一碟。不过,实际情况并不是这样。由于处理业务的特殊性,集团级容灾系统的实现其实相对简单,而省级BOSS容灾系统要考虑的问题就要复杂多了。

中国容灾网,保护数据。

容灾系统的需求分析方式

中国容灾网,保护数据。

在中国移动近期编制完成的《业务连续性系统技术规范书》中,考虑的已不再是单纯的容灾技术,而是从业务连续的角度,以系统连续运行、业务不间断为目标设计系统。

中国容灾网,容灾行业网站。

系统建设的第一步就是进行需求分析。

中国容灾网,保护数据。

目标是行动的方向。所以,我们必须科学地分析和研究,容灾系统或其它安全手段是应对哪些风险威胁和灾难的,界定实际的需求,明确我们的目标。

中国容灾网,护航业务。

首先,要根据各个业务部门直接的业务需要和遇到的问题提出原始业务需求,包括业务种类、业务连续性要求及服务级别要求等。比如用户在前台查询、缴费等操作,其业务连续的要求就比较高;对网元设备进行采集和批价等操作,其业务连续的要求就相对低一些;而与电信企业结算或其它内部的结算,其要求就更低。在进行完整细致的需求分析后,我们可以得出容灾系统的原始需求分析报告。

中国容灾网,保护数据。

其次,根据支撑系统受到风险威胁后,对业务的影响进行科学的分析,反映出业务中断对不同业务的影响程度,包括收入、竞争力、诉讼、公司信誉等等,形成业务影响评估报告。评估的结果可以是绝对值(如估计的经济损失),也可以是相对值(如损失的严重程度),评估的结果应清晰的反映出不同级别的业务中断对各个业务系统的影响。

中国容灾网,保护数据。

由于各种业务的关键程度不同,可容忍的灾难恢复时间与灾难恢复程度也有区别,因此对业务连续性的要求也不同。各种业务连续性的要求应由业务运行的特点、故障对业务的影响程度、数据的重要性、数据的实时性要求、数据量的大小等指标来衡量,另外还应包括系统可容忍的灾难恢复时间(RPO)和系统可用恢复时间(RTO) 。

中国容灾网,容灾行业网站。

根据以上的计算和列表,最终得到业务方面对系统连续运行的完整的需求。 中国容灾网,Rongzai.com.cn。

容灾系统的系统设计原则 中国容灾网,护航业务。

完成需求分析后,下一步就需要进行系统设计。系统设计仍要围绕业务连续性的目标进行。简单来说,就是以业务连续性需求为基础,对可能的技术和管理手段进行详细的分析研究,制定出满足需求、经济可行的实施方案。 中国容灾网,独家发布。

在规划和设计容灾系统时,我们经常出现的问题有两个,一个是贪大求全,认为所有业务都要容灾,导致系统建设投入巨大,造成资金的浪费;另一个是希望在容灾系统设计和建设时,对原系统进行结构性调整,实现系统的升级或更换。从技术层面来说,这两种想法都是有问题的。
 
恢复点与成本关系 中国容灾网,Rongzai.com.cn。

基于需求分析,我们可以科学地计算出一些业务和系统设计参数,进而确定投资平衡点。对于投资平衡点之下的业务,如果不采取措施,出现问题后的损失将非常大,因此可以考虑通过较小的投资解决这些问题;而对于投资平衡点之上的业务,由于投资超过了灾难风险出现时给系统带来的损失,因此我们要谨慎考虑其解决方案。

中国容灾网,容灾行业网站。

另一方面,容灾系统的建设原则是实现业务连续,当系统出现中断时,容灾系统应快速接管。但如果容灾系统和原系统的系统结构、业务功能、技术手段、开发人员等出现比较大的差异时,很难想象能够实现系统切换。因此,是建设一个容灾系统还是另建一个备份系统,这是在系统规划设计阶段不可回避的一个问题。 中国容灾网,容灾行业网站。

系统规划与设计需要考虑的问题很多,这里不一一表述,但原则上,容灾系统的设计与建设不是一个简单的过程,而是需要精心策划、细致研究的。尤其是业务功能,两个系统应完全一致,否则如果前期准备工作做得不充分,容灾系统的建设反而会成为人为制造的灾难。

中国容灾网,Rongzai.com.cn。

容灾系统的建设和运行是一个庞大的课题

中国容灾网,保护数据。

除了搭建计算机系统外,容灾系统的建设还需要做许多工作。比如说,在系统设计阶段我们就要考虑进行实施方案设计,包括上线流程和回退计划,保证系统能够正常上线;还要进行恢复规划设计,就是针对业务系统的状况,确定什么时候启动容灾系统,容灾系统启用的流程如何设计。这些工作都应在系统投产前研究制定。 中国容灾网,独家发布。

在完成上述工作后,可以考虑进入项目实施阶段。组建专业的项目实施组,按照预先设计的实施方案建设、调试和投产,投入正式使用前要进行严格的测试和演习。作为容灾系统要考虑的问题点,每个问题的解决都要通过系统的分析研究和详细的文档设计;当系统外部环境发生变化时,容灾系统的有关流程和技术方案还应进行相应地调整。

中国容灾网,独家发布。

容灾系统建设需要大规模的资金投入,对于这样的系统如何上,怎么上,用户应该理智、科学地对待。作为一个庞大的课题,容灾系统的建设和运行中许多技术和管理的细节问题,并不是简单地将设备买来一堆就万事大吉了。因此当考虑进行容灾系统建设时,要充分分析、理解业务需求,精心组织,保证正常上线运行,达到系统设计目标。 

中国容灾网,保护数据。

(本文作者为中国移动通信集团公司计费业务中心业务支撑处副经理)

中国容灾网,护航业务。



上一篇:十大匪夷所思的数据灾难实例  
下一篇:在电脑前超过4小时一定要看的图