ibm 行业解决方案

    技术2024-07-07  74

    在本文中,我们向您介绍最新发布的灾难恢复(DR)解决方案,IBM®Power Systems™的地理分散弹性,并说明如何与Power Enterprise Pools无缝使用。 我们还将解释按需扩容(CoD)中涉及的概念,然后引导您完成从硬件管理控制台(HMC)GUI和命令行进行配置的步骤。

    什么是电力企业池?

    您可以在IBM知识中心和IBM Power Systems –随需应变容量红皮书中了解有关Power Enterprise Pools的信息。

    简要摘录:

    “ Power Enterprise Pool为Power Systems提供了灵活性和价值。Power Enterprise Pool是一组可以共享移动按需容量(CoD)处理器资源和内存资源的系统。您可以在池中的系统之间移动Mobile CoD资源激活。通过硬件管理控制台(HMC)命令,这些操作在管理系统池中的大型工作负载时提供了灵活性,并有助于重新平衡资源以响应业务需求,此功能对于在维护期间提供连续的应用程序可用性非常有用。可以轻松地将工作负载转移到备用系统,但可以转移处理器激活和内存激活。灾难恢复计划还具有更易于管理的功能,可以将激活转移到需要的位置和时间。”

    什么是IBM Power Systems的地理分散弹性?

    IBM Power Systems地理分散弹性系统解决方案是一种灾难恢复解决方案,易于部署,并提供了自动过程以在灾难恢复时恢复生产站点虚拟机(VM)。 因为应用程序和服务的灾难恢复是提供业务连续性的关键组件,所以IBM地理分散弹性解决方案可帮助客户在故障期间进行自动化的灾难恢复流程。 灾难恢复解决方案主要基于基于集群的技术和基于虚拟机重启的技术。 该解决方案提供了一个简单的部署模型,该模型使用控制器系统(称为KSYS)来监视整个虚拟机环境。 该解决方案还提供了灵活的故障转移策略和存储复制管理。

    您可以在IBMdeveloperWorks®Wiki文档上了解有关Power Systems的地理分散弹性的更多信息: 为什么地理分散弹性是Power Systems的理想DR解决方案和常见问题解答

    企业池和地理位置分散的弹性如何一起工作以优化资源?

    当您具有生产(活动站点)和恢复(备份)站点设置时,应计划在生产站点中配置大部分资源,而在恢复站点中仅保留一小部分资源。 在恢复站点中保留最少的资源可节省大量的硬件资源成本。 但是,如果要在生产站点上遭受灾难,则应该能够将硬件资源移至恢复站点,以便可以将主要站点上运行的所有工作负载在线恢复站点上。 这就是企业池出现的地方。 使用企业池,您可以将大部分资源集中到一个资源池中,并在正常情况下将其分配给生产站点,但是在发生灾难时将其从生产站点转移到恢复站点。

    让我们看一下配置按需容量企业池以及地理分散弹性解决方案的详细步骤。

    要理解本文,需要使用哪些关键的地域分散弹性术语?

    KSYS: KSYS代表C(K)ontroller系统逻辑分区(LPAR)。 部署了地理分散弹性软件的LPAR(当前为IBMAIX®LPAR)。 KSYS充当协调器,用于监视,管理虚拟机并将其从一个站点移动到另一个站点

    ksysrppmgr 命令 :要管理灾难恢复环境中的资源分配,Power Systems的地理分散弹性解决方案提供了资源池配置(RPP)命令ksysrppmgr 。 ksysrppmgr命令调整托管主机上的可用资源。 您无需检查当前可用资源。

    图1.参考环境,说明配置CoD和使用地理位置分散的弹性所涉及的步骤
    Site1:生产站点是在多个VM(LPAR)上运行工作负载的站点。 HMC_1:它是生产站点中用于托管系统的HMC。 (vmhmc1是本文使用的硬件中的生产站点HMC。) 主机_1:生产站点用来托管VM的受管系统。 (kumquat_9179-MHD-105E67P是本文使用的硬件中的生产站点托管系统。) Site2:恢复站点是在发生灾难事件或计划维护生产站点时充当生产工作负载备份的站点。 HMC_2:它是恢复站点中受管系统的HMC。 (vmhmc3是本文使用的硬件中的恢复站点HMC。) Host_2 :当切换工作负载时,它是用于在恢复站点中托管VM的受管系统。 (橙色-9179-MHD-SN107895P是本文使用的硬件中的生产站点托管系统。)

    配置企业池按需容量池

    本文档中详细介绍的配置步骤至少需要以下版本:

    KSYS LPAR应该至少具有AIX 7.2 TL01 SP01 HMC版本8.6

    第1步:

    以root用户身份登录到HMC命令行,然后复制从IBM获得的企业版池配置文件。 该配置文件包含该池中每个系统的Power Enterprise Pool成员资格激活码以及该池的移动处理器激活码和移动内存激活码。 有关如何获取文件,请参考订购Power Enterprise池 。

    第2步:

    使用以下命令在要配置的HMC上生成公钥和私钥:

    /opt/hsc/bin/hscSignal 373 <private key path> <public key path>
    图2.生成公钥和私钥

    第三步:

    使用以下命令从您在步骤1中复制的文本XML文件生成签名的XML文件。

    /opt/hsc/bin/hscSignal 374 <unsigned pool config file path> <private key path> <public key path> <signed pool config file path>
    图3.生成签名的XML文件

    第4步:

    设置主HMC。 第一个HMC成为EPCoD池的主服务器。 提供在步骤3中生成的签名XML,以创建池。 Host_1被添加到HMC_1,并且HMC_1充当主HMC。 使用以下命令创建一个池并将其设置为主HMC:

    mkcodpool -p EPCOD_NAME -f <signed pool config file>
    图4.创建一个池

    步骤5:

    通过首先将备份站点HMC添加到池中,然后添加属于备份站点的主机来设置备份站点HMC。 在这里,将HMC_2添加为备份站点HMC,然后将Host_2添加到HMC_2。

    使用以下命令添加备份站点HMC:

    chcodpool -o add -p <poolname> --mc <hmcname/hmcip> -u <username> --passwd <password> --force

    使用以下命令添加备份站点主机:

    chcodpool -o update -p <poolname> -f <signed pool config file>
    图5.将备份站点HMC添加到池中

    步骤6:

    验证是否同时使用主HMC和备份站点HMC及其各自的主机创建了该池: 使用以下命令在受管系统级别列出池信息:

    lscodpool -p <poolname/poolid> --level sys
    图6.列出不同级别的池信息

    使用以下命令详细列出池信息:

    lscodpool -p <poolname/poolid> --level mc
    图7.列出详细的池信息

    要从GUI验证池配置:

    在硬件管理控制台GUI的左窗格中,展开系统管理 -> Power Enterprise Pool 。 在右窗格的“ Power Enterprise Pool管理”部分中,单击“ 管理HMC” 。

    图8.通过GUI验证池信息

    将地理位置分散的弹性与Enterprise Pools CoD结合使用

    Enterprise Pools CoD可以用于计划的和计划外的地理分散的弹性恢复。

    计划的灾难恢复:计划的移动是一项操作,管理员可以在没有灾难事件且活动站点中的资源可以正常关闭的情况下启动移动。 启动这些类型的操作主要是为了执行DR测试演练,从一个站点移动到另一个站点,或者当其中一个站点需要脱机进行维护时。

    计划外的灾难恢复:在计划外的灾难恢复场景中,诸如电源故障之类的灾难使活动站点瘫痪,无法再从备份站点进行访问。 在这种情况下,需要在备份站点上启动VM,并使软件堆栈重新联机以恢复业务应用程序。 由于灾难使活动站点崩溃,因此活动站点中的资源不再可访问,并且不能通过地理分散弹性(KSYS)自动释放回企业池中。 活动站点启动后,管理员可以使用KSYS手动启动活动站点VM的清理。

    管理员需要执行以下步骤才能从灾难恢复中恢复:

    将资源从活动站点返回到企业池。 将资源分配给备份站点。 启动从活动站点到备份站点的迁移。 如果迁移是计划外的,请从灾难中恢复后清除活动站点中的资源。

    现在让我们详细了解执行上述活动所需的步骤。 在以下步骤中,我们将处理器单元称为资源,但是相同的步骤也适合于内存。

    步骤1:将资源从活动站点返回到企业版池

    假设恢复站点缺少八个处理器单元,我们需要从属于生产站点的受管系统(kumquat_9179-MHD-105E67P)减少八个处理器单元,以便可以将它们添加到恢复站点中的受管系统中(橙色9179-MHD-SN107895P)在下一步中。

    在硬件管理控制台GUI的左窗格中,展开系统管理 -> Power Enterprise Pool 。 在右窗格的“ Power Enterprise Pool管理”部分中,单击“ 处理器资源” 。

    当您打开企业版池页面来管理资源时,您会发现生产站点中的主机当前正在使用这些资源。

    图9.减少活动站点中的资源

    当生产站点上的资源数量减少时,企业池将这些资源作为未归还的资源在生产站点上进行跟踪。

    图10.跟踪未归还的资源

    使用命令:

    ksysrppmgr命令可用于在池中添加资源或从池中删除资源。 您可以使用动作“ e”或“ execute”执行资源请求,或者使用“ c”或“ check”模拟是否满足资源请求。

    图11.用于减少池中资源或从池中添加资源的CLI

    在使用命令行之前,对HMC进行身份验证:

    hmcauth -u <username> -p <password> -a <HMCname>
    图12. HMC授权

    使用ksysrppmgr命令分配资源:

    ksysrppmgr -o c -h [<HMCname>]:<hmcuri>:<username> -m <managedsystem>:<action>::<proc amount> -e <poolname> -v -r
    图13.使用ksysrppmgr分配资源的命令:

    步骤2:将资源分配给备份站点:

    在此步骤中,我们将在上一步中释放的资源分配给恢复站点中的受管系统(orange-9179-MHD-SN107895P)。

    分配给备份站点的资源将是过量使用的许可资源。

    在硬件管理控制台GUI的左窗格中,展开系统管理 -> Power Enterprise Pool 。 在右窗格的“ Power Enterprise Pool管理”部分中,单击“ 处理器资源” 。

    图14.从GUI向备份站点分配资源
    图15.使用命令行将资源分配到备份站点

    步骤3:启动从活动站点到备份站点的迁移 :

    从活动站点启动灾难恢复后,虚拟机将从生产站点迁移到恢复站点。

    迁移成功完成后,如果有计划的灾难恢复,则会自动完成活动站点上VM的清理。 在这种情况下,名为unreturned的资源将返回到池中。当我们调用计划外的DR时,活动站点VM的清理应手动完成,并将资源分配回池中。

    使用以下命令手动调用网站清理:

    ksysmgr cleanup site <backup sitename>

    使用以下命令调用从活动站点到备份站点的站点迁移:

    ksysmgr move site from=<active site name> to=<backup sitename>
    图16.迁移和清理后的池配置

    辅助程序脚本:resourcelocation.sh,resource_reallocation.sh

    正如您已经观察到的那样,步骤1和步骤2是手动活动,您必须执行这些手动活动才能将资源从生产站点重新分配到恢复站点。 我们已经编写了一些简单的脚本,您可以使用这些脚本来自动化这些活动,例如,将资源从活动站点分配到备份站点,然后重新分配资源。 这些脚本也可以在KSYS中注册。 在DR的预验证和后验证操作以及预移动操作期间,KSYS调用这些脚本。

    您可以通过以下方式使用这些脚本:

    手动使用脚本 验证之前运行资源分配脚本,因为它会将资源从活动站点分配到备份站点。 调用验证过程。 确保验证过程成功完成,并且没有任何容量检查错误。 可以使用以下命令完成此操作: Ksysmgr verify site <active sitename> 验证后运行资源重新分配脚本,因为它会将资源从备份站点释放到活动站点。 如果管理员需要继续进行DR操作,请再次运行资源分配脚本。 通过向ksys注册使用资源分配和重新分配脚本

    可以使用以下命令在KSYS中注册这些脚本:

    注册进行预验证: ksysmgr add script entity=site pre_verify="/opt/IBM/ksys/samples/resouce_allocation.sh" 注册后验证 ksysmgr add script entity=site post_verify="/opt/IBM/ksys/samples/resouce_reallocation.sh" 离线注册 ksysmgr add script entity=site pre_offline="/opt/IBM/ksys/samples/resouce_allocation.sh"

    注意事项 :

    如果手动使用,这些脚本必须在KSYS节点上运行。 该脚本查询生产和恢复站点HMC以获取资源信息。 该脚本需要生产和恢复站点HMC的用户名和密码。 这些( SOURCEHMCUSER , TARGETHMCUSER , SOURCEPASSWD , TARGETPASSWD )可以在脚本的开头设置为变量。

    结论

    综上所述,企业级按需容量池和地理位置分散的弹性可通过启用容量检查和在站点之间顺利迁移VM来无缝协作,以优化生产站点与恢复站点之间的硬件资源。


    翻译自: https://www.ibm.com/developerworks/aix/library/au-aix-configuration-enterprise-pool/index.html

    Processed: 0.012, SQL: 10