近些年来,公司管理人员对灾难恢复的态度已发生了变化。长期以来,只有那些依赖大型机的公司才会想方设法防止业务受到干扰。大多数公司抱着这种事不会发生在我们头上的态度。如今,许多公司认识到一次严重的灾难就有可能使公司陷于瘫痪。
随着个人电脑、工作站和局域网变得更加普及,业界也已经开始认识到:单单只有数据中心的恢复方案还不够;需要一种面向整个公司的综合方法,那就是业务恢复规划(business recovery planning)。
业务恢复规划的方法各不相同,正如使用它们的公司也不同那样。有些恢复规划人员试图确认可能对公司的正常运行构成的每一种威胁,包括洪水、火灾、地震、暴风雪、恐怖袭击、故意破坏和停电事故,然后考虑到方案当中。虽然这种全面方法经常有人使用,但要是时间有限、资源紧张,难度似乎很大。有一家公司在恢复规划方面采取了不同方法,它就是德事隆金融公司(TFC),这家商业金融服务公司隶属总部设在罗得岛普罗维登斯的年收入80亿美元的德事隆公司(Textron Inc.)。
应收账款系统主管Dave Raspallo负责TFC的恢复规划工作。他表示,他公司起初试图采用确认多种威胁的方法,但后来发现:想到有可能要针对每种潜在灾难进行规划,管理人员就不知所措。于是,Raspallo改而设计了一种简单的方法,涵盖了灾难可能带来的四个级别的业务中断即后果,分别如下:
·第一级――建筑物遭到破坏或者无法用于业务活动;
·第二级――一层或多层楼面无法使用,但有可能在建筑物内部实现恢复;
·第三级――只有一个公司部门受损,但有可能在建筑物内部实现恢复;
·第四级――只有某个业务功能或者工作站受损,但有可能在同一层楼上实现恢复;
Raspallo说:“无论威胁是火灾、洪水还是其他什么灾难,这种方法始终都持这种观点:外面有好多威胁,但只有几个级别的业务干扰。无论我们的建筑物被火灾烧毁还是被地震毁掉,结果都是一样的:它们都是一级紧急事件。当然,可以为最有可能发生的那些灾难作好规划,许多公司就是这么做的。但这要耗费大量时间,你根本没法为每一种潜在威胁作好规划。”
无论业务恢复规划方法是针对特定的威胁还是基于干扰级别,都应当把数据处理中心看成水电、电话和天然气之类的公用设施或者服务。而这些公用设施(包括数据处理)支撑着一家公司的关键业务功能。
万一公用设施出了故障,恢复服务的责任就落在了公用设施提供商头上。不过,公司恐怕不会关门大吉、坐等公用设施恢复供应。管理人员会寻找替代电源或者提供电力的场地。数据处理同样应当如此。
把数据处理功能视作公用设施对恢复规划而言具有现实意义。这迫使公司去考虑数据处理功能支持的所有业务运营,并且设计涵盖这些重要服务的假设分析场景。
业务规划恢复的一个重要方面就是制订面向整个公司的应急方案,这个方案考虑到了公司的每项关键功能,包括基于纸张的手工系统。因为如今许多大公司有的是真正的跨国公司,而有的有着错综复杂的国际关系,所以为业务恢复规划考虑到公司的地区范围也很重要。恢复方案关注的灾难是不是影响一个地方、多个地方、大片地区还是全球各地的业务运营?
业务规划方案要考虑到各个方面,包括人员、办公场地、数据以及让公司顺畅运行的其他每个因素。 真正的业务恢复规划带来了一项艰苦任务,但可以使用软件系统来帮助公司确定关键业务功能,并且制订涵盖所有关键方面的业务恢复规划。业务恢复规划过程涉及下面六个重大步骤:
一、得到高层管理班子的支持。虽然任何行业里面的高级管理人员都应当认识到需要恢复规划,但许多人还是对这个问题避而不见或者漠然视之,这有诸多原因,比如对潜在威胁存在误解、需要规划成本和人力成本。几种有效的方法可以帮助应急规划人员得到管理人员对面向整个公司的恢复规划的支持。比方说,向管理人员指出媒体上刊登的这种事可能发生到我们头上的种种故事,这样他们会认识到存在潜在问题。
前不久的芝加哥洪水就是个典例,表明会遇到突如其来的灾难。如果安全管理人员或者应急规划人员把这些灾难事故与本公司的情况联系起来,就可以向管理人员表明重大危机可能意味着失去重要的公司资产、市场份额和业务发展势头。严重灾难给账本底线带来的影响应该足以引起高层管理人员的注意。
对那些有幸获得管理人员支持或者已得到支持的人来说,说服工作还没有结束。卓有成效的业务恢复规划人员必须不断解释为何需要应急规划,并且提高一线员工和高级管理人员的安全意识。
二、进行影响分析。虽然数据中心的恢复规划往往只关注着急的应用软件和数据,但业务恢复规划需要规划人员确定发生灾难后必须恢复哪些业务功能。遇到重大灾难后,没有哪家公司有时间或者有资源来恢复每个业务功能领域。目的只是让业务活动回到可以接受的水平。
虽然数据中心是业务规划方案的一个重要组成部分,但不是惟一要考虑的方面。必须评估每个功能领域,查明公司蒙受的损失对面临的法律风险、经营收入、客户服务或者其他运营环节带来了怎样的影响。这种分析名为业务影响分析。对每个功能领域进行评估,划分为遇到灾难后需要恢复的关键领域、必要领域或者可选领域。
三、准备恢复策略。一旦关键的业务功能确认完毕,公司就必须确定这些关键功能领域所需的最少资源库存。这些资源包括:人员、设备、工作场所、表格和必需品、电信需求、软件、关键记录与数据以及供应商。恢复规划人员必须采取措施,防止灾难影响关键功能领域所需的资源。
公司还必须设立一个或者多个场地,那样遇到危机后就可以派上用场。这包括指挥中心(遇到灾难后所有重要人员都集中到这里)和足够宽敞的场地,以便恢复所有关键的业务功能。公司常常可以请来房地产专家或者经纪人,确认及更新所在地区的空余办公室。这些办公室可以租赁有限的一段时间。
四、起草恢复方案。一旦最初的研究工作完成,应急规划人员现在必须致力于制订书面的业务恢复规划。这可能是项艰苦的任务。业务恢复规划软件有助于加快方案起草。另外还可以借助众多的咨询公司。
软件工具、尤其是基于关系数据库系统的那些工具,可用来捕获起草方案所必需的动态信息。这些信息可能包括冗长的库存清单。比方说,用来处理数据的每个关键设备可以列入库存,并列出优先级。可能还要为公司所需的语音和数据电信设备建立库存,包括列出每条线路及其用途的清单。这种内容详尽、不断变化的信息最好通过灵活的关系数据库来加以管理,因为关系数据库能够交叉参考登记的新条目,那样属于多个部门的信息只要输入一次。如果信息通过关系数据库来收集,示范方案就会自动加以定制,以满足公司的具体要求。
良好的自动化工具也会有集成的文本处理程序,那样恢复文档就很容易创建、编辑及发布。比方说,加拿大规模最大的银行之一:多伦多道明银行(Toronto Dominion Bank)正使用业务恢复规划软件,加快为其90个银行部门中的80个制订恢复方案的工作。
据多伦多道明银行的恢复规划经理Des O'Callaghan声称,规划软件让这家银行得以迅速完成方案的制订,大约每个月就能制订好方案。O'Callaghan说:“我们需要规划系统可以提供标准化的方式来评估各部门的重要性、提供审计跟踪记录,而且使用起来简单、灵活。除了这些明显的优点外,我们还发现自己的恢复规划项目是一种重要的营销工具。我们可以告诉客户,我们落实了方案来保护自己的业务和资产。我们的许多竞争对手做不到这一点。”
书面方案还必须加入有关如何指导及执行恢复工作的说明。 得到许多公司广泛认可的一个惯例就是,设立明确了恢复工作职责的团队结构。应急规划人员需要制订相应程序,涉及通知团队成员、控制中心运营、损坏评估及恢复等任务。
五、采取实际测试。一旦书面方案起草完毕,应当在模拟真实灾难的环境中接受全面测试。以全面的业务恢复规划为例,想对方案的每个方面都进行测试几乎是不可能的。不过,通常至少可以对方案的每个要素进行被动测试。
在许多公司,每个部门可以隔离开来,进行恢复程序方面的测试。一种方法就是断掉某个部门的计算机链路,让这个部门进行恢复,就像遇到真的灾难那样。另一种办法就是测试一下出现故障的基于纸张的应用系统。测试不但可以证实方案切实可行,还有助于增强一线员工和管理人员的信心。
六、不断完善方案。就算书面方案已分发下去,并经过了测试,还不算大功告成。方案从来就没有万事大吉的那一天。它是一种活文档,需要不断更新。
规划人员在制订方案时,必须记住:公司在不断变化。维护是一大问题:人员调动、引入新设备、公司进行合并。一旦出现了这些变化,它们应当考虑到方案当中。客户信息、人员变动和程序改变都应当全部记下来。一旦出现了变化,应当迅速创建新的方案文档,并分发下去。
遇到重大灾难后,客户服务、工资表格、公共关系、数据处理及其他许多功能领域对公司来说至关重要。数据中心的恢复方案从来提供不了足够力度的保护,无力防范全面的灾难。许多公司现在更需要全面的业务恢复方案。虽然这种方案肯定包括恢复数据处理资源,但它们也涉及组成一家成功公司的其他许多关键业务功能。无论是法律要求这样(就像美国的银行业),还是仅仅是良好的经营惯例,业务恢复方案对每家公司来说都很有必要。