越来越多的行业用户选择利用云计算技术构建自己的数据中心,但业务集中、数据集中的同时,也意味着风险的集中。
一旦发生数据中心人为误操作、网络故障甚至灾难时,企业及分支机构将无法对外提供服务,甚至关键数据也会丢失。
从GitLab事件看企业灾备现状
去年,全球知名的开源托管服务平台GitLab数据丢失事件可能大多数人还印象深刻,因为缺乏完善的灾备方案,人为误删数据库致使系统宕机,并且长时间无法恢复。庆幸的是,运维工程师利用一次偶然产出的LVM快照,使数据得以恢复到6个小时之前的状态,但中间丢失的那部分数据对用户的潜在影响是无法用数字衡量的。
事实上,缺失灾备方案的并不只有GitLab,诸多企业均存在类似的情况。由于成本和技术等原因,企业只应用传统的本地备份方案,并且通常只针对企业重要的业务数据(数据库、电子邮件等)进行备份,而不对操作系统及应用程序进行备份。故障发生后,需要耗费大量的时间在备份文件的导入恢复和配置上。业务恢复周期长、操作复杂,很多企业在做了灾备方案后,却束之高阁,无法应用。
因此,如何以更高的性价比实现企业业务连续性,平衡风险、效率与成本,是当前企业用户的迫切期望。
企业灾备建设需要“因地制宜”
不同类型的风险其影响程度、发生概率和造成的损失大小是不同的, 在讨论企业灾备建设方案之前,可以将企业各信息系统所面临的风险因素、概率、影响和应对手段进行分析,以便于企业根据风险的抵御能力以及应用系统的重要程度,评估如何采取相应的灾备措施来减低各种风险和威胁可能带来的影响和损失。
企业信息化风险评估与应对措施
根据上面的分析,基于不同的风险抵御能力,灾备的建设分为两个维度、四个层次:
- 数据维度(本地、异地)
- 业务维度(同城连续性、异地连续性)
企业应用云计算技术之前,灾备的建设更多还是解决数据层面的问题,主要是利用传统存储设备的数据复制特性,由存储设备统一完成上层业务(包括数据库系统)的跨地域数据复制。但因为技术绑定和所有业务系统共吃一个”大锅饭”的原因,建设成本高昂,灾备效率不高,兼容性和数据一致性也存在一定的风险,并且由于只是数据级的复制,依旧无法解决数据备份和业务恢复复杂度高的问题。