第
29
卷第
8
期 计算机应用与软件
Vol. 29 No. 8
2012
年
8
月
Computer Applications and Software Aug. 2012
金融行业灾备架构高指标
RTO
的实现方式
施跃跃 徐景良
(
中国银联股份有限公司信息总中心 上海
201201)
收稿日期
: 2012 - 03 - 02。
施跃跃
,
工程师
,
主研领域
:
金融
IT。
徐
景良
,
工程师
。
摘 要 传统的灾备架构普遍存在业务恢复时间长的问题
,
不能适应金融行业的发展
。
双活技术为提高
RTO
指标指出了一个方
向
。
通过对目前金融行业灾备架构中几种常用数据复制实现方式的比较
,
得到不同方式与
RTO
指标的关系
,
说明使用应用级复制
方式实现双活是达到
RTO
最高指标的可选技术方案
,
着力分析了自动切换原理
,
指出这两点是双活技术的实现条件
。
经实践证明
,
提出的双活灾备架构是行之有效的
。
关键词 灾备架构
DRP RTO RPO
数据复制 双活
中图分类号
TP306
文献标识码
A
IMPLEMENTATION APPROACH FOR DISASTER RECOVERY ARCHITECTURE WITH
HIGH INDICATOR RTO IN FINANCIAL SECTOR
Shi Yueyue Xu Jingliang
( Information Center,China UnionPay Co. ,Ltd. ,Shanghai 201201,China)
Abstract Traditional disaster recovery framework cannot adapt to the development of financial industry because of the ubiquitous problem
of long business recovery time. Dual-active gives a direction to improve RTO indicators. By comparison of several frequently used implementa-
tion ways of data replication in current disaster recovery framework for financial industry
,we get the relationship between different ways and
the RTO indicators,they indicate that by using application-level replication to realise dual-active is an optional technological scheme to reach
the highest indicators of RTO. We focus on the rationale of automatic switching,and point out that these two are the conditions to realise the
technology of dual-active. Proven by practice,the dual-active disaster recovery framework proposed in the article is effective.
Keywords Disaster recovery framework DRP RTO RPO Data replication Dual-active
0
引 言
随着信息技术的高速发展
,
金融行业已达到对信息系统完
全依赖的程度
,
信息系统的中断将导致金融服务中断
,
而数据丢
失甚至会导致金融企业破产
,
其损失都是无法估量的
。
信息系
统的灾备建设受到国家与企业的高度重视
,
灾备系统建设的规
模也达到空前水平
[1]
。
但是
,
目前金融行业灾难恢复计划
( DRP)
的设计中
,
最重
要的两个实施目标
RTO(
业务恢复时间目标
)
与
RPO(
数据恢复
点目标
)
的发展水平并不平衡
。
数据恢复点目标
RPO
可以使用
多种通用产品来实现
,
而业务恢复点目标
RTO
的实现与各数据
中心的应用架构关系紧密
,
需要定制化的解决方案
,
实现难度相
对较大
。
由于高指标
RTO
的实现难度大于高指标
RPO
的实现
难度
[2]
,
国内数据中心普遍存在重视
RPO,
弱化
RTO
的灾备架
构设计思想
,
甚至部分灾备中心只有数据备份
,
没有业务接管能
力
,
或是有业务接管能力但灾备切换业务中断时间过长
[3]
。
这
些情况的普遍存在
,
使数据中心在应对灾难时
,
往往业务恢复时
间长
,
严重影响对外服务质量
[4]
。
金融行业也在不断探索提高
RTO
指标的方法
,
其中双活架
构被认为是最高级别的灾备架构实现方式
。
本文提出了数据复
制方式和自动切换方式是提高
RTO
指标的两个重要因素
,
阐述
双活架构有哪些类型
,
双活架构下如何采用数据复制技术
,
并实
现快速自动切换
。
1
影响
RTO
指标的主要因素
恢复时间目标
( RTO) ,
指信息支撑系统或者目标业务系统
从停顿状态恢复至正常运营状态所需要的总时间
[5]
。
其原理
图见图
1
所示
。
图
1
恢复时间目标原理图
要想提高
RTO
指标
,
需要先分析业务中断时间的长短与哪
些因素有关
。
从金融行业计划外灾难切换的实际情况看
,
灾备
切换的过程如图
2
所示
。