容灾是什么意思?
容灾(Disaster Tolerance),就是在自然灾害、设备故障、人为操作破坏等的灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统的业务不间断地运行。
和容灾易混淆的概念
容错(Fault Tolerance)
容错和容灾最大的区别是,容错可以通过硬件冗余、错误检查和热交换再加上特殊的软件来实现,而容灾必须通过系统冗余、灾难检测和系统迁移等技术来实现。
灾难恢复(Disaster Recovery)
灾难恢复和容灾的区别是,容灾强调的是在灾难发生时,保证系统业务持续不间断地运行的能力,而灾难恢复强调的灾难之后,系统的恢复能力。
容灾备份的区别
备份只能满足数据丢失、数据破坏时的数据恢复目的,而不能提供实时的业务接管功能。容灾往往是针对当生产系统不能正常工作时,其业务可由容灾系统接替这些业务,继续进行正常的工作。
容灾必须满足的三个要素
1、先是系统中的部件、数据都具有冗余性,即一个系统发生故障,另一个系统能够保持数据传送的顺畅;
2、具有长距离性,充分长的距离才能够保证数据不会被一个灾害全部破坏;
3、容灾系统要追求全方位的数据复制。
容灾的指标参数
有两个关键指标我们必须要了解:RTO和RPO。
RTO(RecoveryTimeObjective,恢复时间目标)是可容许服务中断的时间长度。RTO数值越小,代表容灾系统的数据恢复能力越强。提升RTO的常用技术及其RTO的表现见下表:
RPO(RecoveryPointObjective,恢复点目标)是指能容忍的最大数据丢失量,是指当业务恢复后,恢复得来的数据所对应时间点。提升RPO的常用技术及其RPO的表现见下表:
国内外知名的容灾软件
中兴新支点Newstart HA
NewStart HA是由中兴旗下子公司新支点研发的容灾软件,无需改变任何服务和应用,即可保证系统故障和部件故障时应用不中断;可以自动监控服务器、网卡、浮动 IP 、存储和业务,生产中心失效会自动切换到灾备中心;可实现数据实时同步,切换时间为秒级,为系统提供电信级,高达 99.999% 的高可用性。
Data Protector
进口软件,是存储提供商大厂之一的HP公司出品,充分考虑了对磁带库的支持,不能实现实时备份以及任意回退,但是为了迎合客户需求,他们增加了业务的连续性保护,当数据备份到磁盘上时,可以快速的回复业务。
SIMPANA
进口软件,专业的存储软件公司CommVault的旗舰产品,里面包含了Galaxy和Quick Recovery两款产品。Galaxy是定位在数据保护上的产品,QuickRecovery加入了高可用的概念。它的产品概念依然延续了国外的标准,分为管理服务器、介质服务器和客户端代理。
,