介绍分析和交流ICT行业最前沿技术,分享云计算、存储、服务器、数据中心、网络、软件定义和虚拟化等相关知识,旨在知识交流、开放共享和共同进步。

云备份与云灾备的区别(云上云下容灾微软Azure)(1)

云备份与云灾备的区别(云上云下容灾微软Azure)(2)

前几天看到一句有关云发展趋势的描述,私有云已在身后、公有云还在彼岸、混合云就在脚下。个人感觉这个说法也比较符合云发展的现实情况。今天讨论的话题跟混合云容灾有关,微软Hyper-V和VMware在私有市场占据半壁江山,针对客户的私有云,他们也提供了私有云和混合云容灾方案。这一篇文章我们先讨论下微软的云容灾方案,下一篇我们对于的来讨论VMware的Site Recovery Manager方案。

关于容灾的基础知识,如恢复点目标(RPO)、恢复时间目标(RTO)、容灾等级等,在此我就不多说了,不清楚的读者可以在网上查查资料。

微软刚刚发布云容灾工具时,起名字叫Hyper-V Recovery Manager,这项服务允许Azure或Hyper-V虚拟机可以在主备站点实现数据容灾和恢复。后来微软更名为Azure Site Recovery,从更名来看,Azure Site Recovery更加接近Azure云服务,支持私有云之间容灾、私有云和Azure公有云之间容灾。主备站点数据同步可以基于Hyper-V Replica功能或存储的远程复制功能实现,另外,配合System Center Virtual Machine Manager (SCVMM)来实现阵列管理和复制业务配置。

Azure Site Recovery(ASR)可以对虚拟机进行类持续复制和故障转移功能,为虚拟机和数据提供保护。使用ASR必须先要申请Azure公有云账号,用来配置复制任务,建立容灾、恢复管理任务等。ASR具有广泛兼容性,支持Windows环境和Linux环境等,无论是基于Hyper-V、VMware,还是其他平台的物理环境,都可提供混合云业务连续性解决方案。

私有云容灾

在私有云环境中,主备站点存储都由一家厂商提供,有时甚至是同一型号。为了节约主机资源、避免业务影响,一般建议采用存储阵列的快照和复制功能,实现在企业内部的私有云之间进行同步或异步数据复制,同时,可以借助ASR和SCVMM建立基于端到端存储阵列的复制、灾难和恢复功能。

另外,采用SAN的远程复制代替Hyper-V Replica使得复制过程不依赖于应用程序,也可从整体上进行数据保护。存储厂商提供的SCVMM SMIS Provider可以使阵列与SCVMM实现基于标准的集成,采用ASR Provider可以实现虚拟机从一个站点备份到Azure,或者两个私有云站点之间的故障恢复和备份。

在保护站点和恢复站点(主备站点)分别安装存储厂商提供的SMI-S Provider。SMIS Provider一般安装在一台服务器上,实现SCVMM具体工作流和存储适配,通过SCVMM发现存储,SCVMM对存储的所有操作都是通过SMIS Provider实现的,如分配资源池、创建Hyper-V集群、创建LUN、创建复制组(Replication Group)和创建私有云等。

云备份与云灾备的区别(云上云下容灾微软Azure)(3)

首先需要在主备站点配置好网络、创建后Hyper-V集群、创建复制组(在备站点配置)和私有云,然后需要采用申请的Azure帐号登录公有云创建保管库,通过保管库才能创建容灾、演练和恢复计划。

如果要通过存储阵列的远程复制实现主备数据同步,还需要在主备站点安装ASR Provider,来配合Azure Site Recovery实现容灾恢复工作。通过Azure

Portal登录并选择保管库来发现主备存储阵列、创建和配置存储阵列映射,让Azure Site Recovery感知之前创建的复制组,最后创建保护任务。ASR支持故障转移测试、计划非计划故障转移、反向复制等。

混合云容灾

微软提供了混合云容灾方案,可以把客户私有云的数据容灾到Azure公有云上,节约客户灾备中心建设投资。在公有云环境中,具体采用什么存储或底层基础设施对客户是不可见的,同样,客户私有云环境的存储等设施对公有云服务提供商也不可见,所以私有云和公有云间的数据同步无法通过存储复制功能实现,只能通过Hyper-V Replica功能实现。

云备份与云灾备的区别(云上云下容灾微软Azure)(4)

混合云已逐渐变成主流,但是什么样的事情适合上公有云、数据安全和数据复制对业务影响是客户和云服务供应商所重点考虑的。但是,如果私有云中的虚拟机负载过重也不建议容灾到Azure公有云,容灾数据流对主业务的影响比较大,或者至少要通过RTO和RPO等SLA要求来评估。

ASR支持业务流程编排和定制化,包括执行自定义 Windows PowerShell 脚本、Azure 自动化 Runbook 和暂停运行以进行人工干预,让客户在业务切换或恢复过程中加入定制化的步骤和过程。Windows Azure已经在容灾功能上做了很多优化,如以下重要的新功能:

容灾是“养兵千日、用兵一时”的长期系统工程。一方面,建立容灾可以满足部分企业或行业的法规要求,但从另一方面讲,绝大多数企业都是具有真实灾备诉求。灾备建设除了技术本身要跟上之外,容灾计划、管理体系也要配合到位。当真正发生灾难后,是进行本地恢复、还是远程切换,这都是技术之外,需要技术管理者和决策者决策的事情。感兴趣的读者请关注我们ICT架构师技术交流公众号,后面打算做个容灾专题来全面介绍容灾。

文章来自ICT架构师技术交流“ICT_Architect”公众号,关注获取更多精彩内容。

,