本文的内容仅限于技术探讨,不能作为指导生产环境的素材; 鼓励读者购买红帽培训获得更多系统性的培训。 由于篇幅有限,文章中的步骤仅展现了关键的部分。 一、基于全开源的 “双活/灾备” 解决方案 方案包含涉及到的软件: RHV 4.2 GlusterFS 3.4 Ansible Tower3.3 (双活不需要,灾备需要) 二、双活 双活方案使用RHV延伸群集(Stretch Cluster)实现。两个站点只有一个RHV群集的环境,该群集包含能够在其中运行所需虚拟机的主机。 两个站点都处于Active状态,如果主站点不可用,则为Red Hat Virtualization环境将继续在第二个站点运行,以确保业务连续性。 双活方案需要在两个站点上都可写的复制存储,以允许迁移虚拟机 站点之间并继续在站点的存储上运行。 如果主站点不可用,虚拟机将迁移到辅助站点。虚拟当站点可用和存储时,计算机将自动故障回复到主站点。存储在两个站点都被复制。 设计双活数据中心我们需要考虑很多因素: 本文我们先从网络和存储进行分析。 网络考虑: 群集中的所有主机必须通过L2网络位于同一广播域中。这意味着两个站点之间的连接需要是L2。对于两种设置,L2网络上的站点之间的最大延迟要求不同。独立管理器环境要求最大延迟为100毫秒,而self-hosted engine要求最大延迟为7毫秒。 存储考虑 红帽虚拟化的存储域可以由块设备(SAN - iSCSI或FCP)或文件系统(NAS-NFS,GlusterFS或其他符合POSIX的文件系统)。更多 这些站点需要同步复制的存储,该存储可在具有共享第2层(L2)的两个站点上写入网络连接。需要复制存储以允许虚拟机之间进行迁移站点并继续在站点的存储上运行。 三、灾备 RHV支持可以跨越两个站点的Active-Passive灾难恢复解决方案。如果 主站点变得不可用,可以强制Red Hat Virtualization环境进行故障转移 到Passive站点。 通过在Passive站点中配置Red Hat Virtualization环境来实现故障转移 要求: Passive站点有正常的Red Hat Virtualization Manager。 Passive站点有正常的数据中心和集群。 Passive站点有与主站点具有相同通用连接的网络。 Passive站点有,能够在故障转移后运行关键虚拟机的活动主机(RHV-H)。 failover和failback是手工执行的。我们创建Ansible Playbooks在站点之间映射实体,并管理故障转移和故障回复过程。 当环境故障转移到站点B时,首先在站点中附加并激活存储域B的数据中心,然后注册虚拟机。 网络考虑: A-P方案要求两个数据中心的网络必须是互通的。 存储考虑: 需要主存储副本和辅助存储副本。主存储域的块设备或必须复制包含虚拟机磁盘或模板的共享。灾备站点存储必须不附加到任何数据中心,并将在故障转移期间添加到备份站点的数据中心。 四、灾备方案的实验展现 主数据中心: 1.概览:虚拟机数量为9,存储是活动的: 2.存储:glusterSD1是附加的 3.网络: 4.虚拟机: 灾备数据中心: 1.概览:虚拟机数量为0,存储为down 2.存储:glusterSD1是未附加的 3.网络 4.虚拟机,数量为0. 接下来,登录Ansible Tower: 首先执行模板,模拟主数据中心发生故障: 查看ansible playbook日志: 主数据中心主机出现故障: 主数据中心所有虚拟机停止: 主数据中心储存down: 此时查看备数据中心,依然没有虚拟机: 接下来,运行灾备切换的playbook: 查看运行过程,使用ansible workflow,先执行存储切换,再执行虚拟机切换。 存储切换日志: 虚拟机切换日志: 执行成功后,登录灾备中心RHV-M,可以看到虚拟机已经切换成功 魏新宇 '大魏分享'运营者、红帽资深解决方案架构师 专注开源云计算、容器及自动化运维在金融行业的推广 拥有MBA、ITIL V3、Cobit5、C-STAR、TOGAF9.1(鉴定级)等管理认证。 拥有红帽RHCE/RHCA、VMware VCP-DCV、VCP-DT、VCP-Network、VCP-Cloud、AIX、HPUX等技术认证 |
|