如何在IBM Power地理位置分散性弹性系统中保护KSYS节点?

    技术2024-07-11  69

    什么是IBM Power Systems的地理分散弹性?

    IBM®Power Systems™的地理分散弹性解决方案是一种灾难恢复解决方案,易于部署,并提供了一个自动过程,可在灾难期间在远程或故障转移站点恢复虚拟机(VM)。 由于应用程序和服务的灾难恢复是提供业务连续性的关键组件,因此IBM地理分散弹性解决方案可帮助客户在故障期间进行自动化的灾难恢复流程。 灾难恢复解决方案主要基于基于集群的技术和基于虚拟机重启的技术。 该解决方案提供了一个简单的部署模型,该模型使用控制器系统(称为KSYS)来监视整个虚拟机环境。 该解决方案还提供了灵活的故障转移策略和存储复制管理。

    您可以在IBMdeveloperWorks®Wiki文档上了解有关Power Systems的地理分散弹性的更多信息: 为什么GDR是Power Systems和FAQ 的理想DR解决方案 。

    IBM地理分散的弹性中使用的关键术语

    KSYS :KSYS是逻辑分区(LPAR),当前是IBMAIX®LPAR,在其中部署了地理分散的弹性软件。 KSYS充当协调器,可以监视,管理虚拟机并将其从一个站点移动到另一个站点。 KSYS代表C(K)ontroller系统LPAR。 使用ksysmgr命令以以下格式配置ksysmgr : ksysmgr ACTION CLASS [NAME] [ATTRIBUTES...] 站点 :这是一个逻辑名称,代表主站点或活动站点以及灾难恢复或备份站点。 站点必须在KSYS级别上创建。 所有硬件管理控制台(HMC),主机,虚拟I / O服务器(VIOS)和存储设备都映射到其中一个站点。 网站可以是以下类型: 活动站点(或主站点):这是指在特定时间运行工作负载的当前站点。 备份站点(或灾难恢复站点):这是指在特定时间充当工作负载备份的站点。 在灾难或潜在灾难期间,工作负载将移至备份站点。 主机 :主机是HMC中的受管系统,主要用于运行工作负载。 主机由HMC中跟踪的通用唯一标识符(UUID)标识。 主机对表示在站点之间配对以实现高可用性和灾难恢复的一组主机。 虚拟机:虚拟机(也称为逻辑分区)与特定的VIOS分区关联,用于虚拟化存储来运行工作负载。 一个主机可以包含多个虚拟机。 存储代理 :灾难恢复解决方案需要有组织的存储管理,因为存储是任何数据中心中至关重要的实体。 GDR解决方案依赖于从活动站点到备份站点的数据复制。 在GDR解决方案中,通过使用存储复制将数据从活动站点复制到备份站点。 站点发现 :完成初始配置后,KSYS节点将发现主站点和备份站点中由HMC管理的所有主机,并显示状态。 发现期间,KSYS节点监视所选站点内所有受管主机中所有LPAR或VM的发现。 KSYS节点收集每个LPAR的配置信息,并显示状态。 KSYS节点发现每个VM的磁盘,并检查当前是否为存储设备镜像配置了VM。 站点验证 :在验证阶段,KSYS节点从HMC中获取信息,以检查备份站点在灾难期间是否能够承载VM。 KSYS节点还验证与存储复制相关的详细信息。 灾难恢复 :在验证阶段之后,KSYS节点将继续监视活动站点,以查看站点中任何资源中的任何故障或问题。 如果发生计划内或计划外的中断,并且如果这种情况需要进行灾难恢复,则必须使用将虚拟机移至备份站点的ksysmgr命令手动启动恢复。

    问题陈述

    建议的KSYS设计最佳实践是,KSYS节点必须与运行生产工作负载VM的站点不在同一站点上。 这样的设计即使在灾难袭击生产站点时也可以确保KSYS节点正常运行,并且可以在备份站点上增加工作量。

    在本文中,我们讨论了仅使用活动站点和备份站点时如何保护KSYS节点。

    图1.推荐设计

    我们建议在不运行生产工作负载的站点上运行KSYS节点的简单最佳实践。 这意味着当生产工作负载在活动站点上运行时,KSYS节点必须在备份站点上运行,而当工作负载移至备份站点时,KSYS必须在活动站点上运行。 例如,假设生产工作负载在活动站点上运行,而KSYS节点在备份站点上运行。 现在,如果在活动站点上发生灾难,则备份站点上运行的KSYS节点将能够启动工作负载VM到其他站点的意外迁移。 同样,当您的生产工作负载虚拟机在备份站点上运行时,理想情况下,KSYS节点必须在活动站点上运行。

    这项建议(尽管从逻辑上讲需要解决一个重要的空白, 但是当生产工作负载VM移动时,KSYS节点如何将自身交换到相对的站点?

    实施推荐设计

    为了确保KSYS节点可以从活动站点转移到备份站点,并且类似地从备份站点转移到活动站点,我们需要以相反的方向复制KSYS节点VM磁盘。

    假设生产工作负载虚拟机在活动站点上,而KSYS节点在备份站点上运行。 现在,让我们引导您完成实现复制所需的步骤。

    请参阅以下要使用的示例硬件设置:

    站点1是活动站点(在此示例中为Austin)。

    站点2是备份站点(在此示例中为印度)。

    主机1_1是活动站点(在本示例中为doit3-8233-E8B-06DA59R)上的主机(受管系统)。

    主机2_1 :是备份站点(在本示例中为doit4-8233-E8B-06DA5AR)上的主机(受管系统)。

    VM :是与生产工作负载(在此示例中为demo_vm)一起运行的虚拟机(或LPAR)。

    存储 :是将磁盘分配给KSYS节点的存储。 在以下示例中,主站点上的KSYS节点具有来自EMC VMAX 508的磁盘,而备份站点上的KSYS节点具有来自EMC VMAX 573的磁盘。

    KSYS节点 :是运行ksysmgr的节点。 ksysmgr命令用于创建和处理配置。 我们已将LPAR命名为KSYS节点。

    步骤1:创建一个KSYS节点

    在主站点上创建一个KSYS节点,其配置与备份站点上的配置类似。 确保主站点上的KSYS节点未处于激活状态,而备份站点上的KSYS节点已启动并正在运行。

    图2.活动站点上的HMC VM中的设置详细信息

    步骤2:将磁盘从主站点复制到备份站点

    接下来,将备份站点(印度)KSYS节点的磁盘镜像或复制到主站点(奥斯丁)。 复制模式可以是sync或async 。 我们将在演示中使用同步复制模式。

    复制的方向是从备份站点到活动站点。

    图3.从备份站点到活动站点的磁盘复制

    配对成功后,我们可以检查磁盘的状态以查看其是否处于同步状态。 同步状态表示次映像中的数据与主映像中的数据相同。

    图4.检查磁盘对状态

    步骤3:开始从主站点转移到备份站点

    假设灾难袭击了活动站点。 我们启动从活动站点到备份站点的恢复过程。 可以使用ksysmgr命令完成此操作:

    Ksysmgr move site from=<active site> to=<backup site>
    图5.从活动站点到备份站点
    图6.将HMC中的VM详细信息从活动站点移到了备份站点

    步骤4:取消管理备份站点上的现有KSYS节点

    将发现主站点(奥斯汀)上的KSYS节点并将其添加到KSYS配置中。 因此,我们应该取消管理主站点(奥斯汀)上存在的KSYS节点

    可以按以下步骤完成:

    Ksysmgr unmanage vm {name=<VM name > host= <hostname> | uuid=<VM uuid>}

    步骤5:关闭备份站点上的KSYS节点

    当活动站点VM(生产VM)已成功移至备份站点并且活动站点已从灾难中完全恢复后,请从备份站点关闭KSYS节点。

    将复制方向从活动站点(Austin)更改为备份站点(India)。 本文介绍了Dell EMC存储磁盘的复制。

    禁用磁盘对。
    图7.禁用磁盘对同步
    拆分磁盘对。
    图8.分割磁盘对
    交换磁盘对。
    图9.更改复制路径
    从活动站点(奥斯汀)到备份站点(印度)建立磁盘对。
    图10.建立磁盘对同步
    等待并检查,直到磁盘对处于同步状态。
    图11.验证磁盘对状态

    步骤6:激活KSYS节点

    从主站点(奥斯汀)激活KSYS节点。

    图12.从HMC激活KSYS节点

    确保在KSYS节点迁移之后IBM.VMR守护程序(由KSYS使用)是活动的。 现在,KSYS节点已迁移到当前备份站点,并将监视在当前活动站点(印度)上运行的VM。

    图13.检查IBM.VMR守护程序状态

    将生产虚拟机移至备份站点后,将发现备份(印度)站点上的KSYS节点并将其添加到KSYS配置中。 因此,我们应该取消管理备份(印度)站点上的KSYS节点。

    可以按以下步骤完成:

    Ksysmgr unmanage vm {name=<VM name > host= <hostname> | uuid=<VM uuid>}

    从新的KSYS节点调用发现和站点验证,以验证当前活动的站点(印度),并在发生灾难时检查备份站点(Austin)是否能够托管VM。

    图14.在新的活动站点上发现(印度)
    图15.来自新的KSYS节点的验证过程

    结论

    本文说明了如何始终保护KSYS节点并确保KSYS节点始终监视运行工作负载的生产VM。

    资源资源

    为什么GDR是电力系统的理想DR解决方案 常问问题

    翻译自: https://www.ibm.com/developerworks/aix/library/au-aix-safeguard-KSYS-node/index.html

    Processed: 0.030, SQL: 9