IT行业的灾难定义系为由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。容灾建设的目的即为消除或更大程度减小上述灾难事件对业务系统的影响、保证业务系统的持续运行。
环亚时代的容灾解决方案遵循国际DRII卓越实践和国标GB/T 20988-2007(信息系统灾难恢复规范),为客户提供从咨询、设计、开发、实施和演练的一揽子服务。
根据项目定义的容灾目标, 环亚时代将帮助客户针对其现有环境进行评估和分析,包括风险评估、业务影响评估和当前环境评估。
风险评估将对系统风险进行分析和分类,包括:确立当前核心业务系统存在哪些无法接受的物理威胁和可能发生的灾难、针对各种灾难发生的可能性进行定性分析、明确以后的系统要抵抗的灾难、针对哪些灾难需要启动灾备系统等。风险分析可以采用制定风险分析模板和问卷、进行现场勘查、从自然环境、物理设施以及人为因素各个方面进行分析等方法和手段。
业务影响分析将针对系统面对的风险可能造成的损失进行分析,包括:确定各应用的优先级、对业务流程进行分析,明确各种灾难对业务造成的影响、确定业务系统的容灾要求(RTO/RPO)、明确核心业务系统恢复时所需的更小资源、明确核心业务系统之间的关联性和数据的传递关系。业务影响分析可以采用制定业务影响分析模板和问卷,与业务部门访谈, 对核心系统各业务模块收集信息,识别关键业务流程、识别各业务流程所需资源、明确各业务系统恢复时所需的更小资源以及明确核心系统中业务模块之间数据的传递关系等方法和手段。
当前环境评估将评估当前客户核心业务系统环境,得到当前环境( 从IT、数据流、流程和组织等角度出发) 与恢复目标之间的差距。评估手段包括制定容灾环境分析模板和问卷,和相关部门访谈, 明确目前IT系统功能和容灾能力、数据流的运转效率、流程的有效性和组织的成熟性,综合统计分析。
根据风险评估和业务影响分析的结果,制定容灾策略和目标,提出容灾标准的建议,以及针对不同应用系统提出灾备层次建议,容灾地点的选择;容灾策略选择,自建与外包分析。
确定灾难定义和启动判断条件,定义容灾组织架构和人员角色、职责,定义从灾难声明、组织响应和人员职责、技术恢复到回切到正常业务系统的IT管理流程,描述IT系统各个环节备份和恢复方案的详细操作步骤,定义从灾备系统回复到正常业务系统的条件、实施流程和操作步骤。
确定容灾总体架构,依据不同应用系统的RTO和RPO指标, 制订数据复制方案和应用接管方案。
根据容灾目标和BCP流程,设计和执行BCP演练,演练形式包括:纸面演练、测试环境演练、真实环境演练等。通过容灾演练,可以及时发现容灾流程以及人员组织方面的不足,并有针对性的通过人员培训、优化流程与组织架构等工作提高容灾管理水平。