ibm power

    技术2024-07-21  80

    什么是IBM Power Systems的地理分散弹性?

    IBM®Power Systems™的地理分散弹性解决方案是一种灾难恢复(DR)解决方案,该解决方案易于部署,并提供了一个自动过程,可在灾难期间在远程或故障转移站点恢复虚拟机(VM)。 由于应用程序和服务的灾难恢复是提供业务连续性的关键组件,因此IBM地理分散弹性解决方案可帮助客户在故障期间进行自动化的灾难恢复流程。 灾难恢复解决方案主要基于基于集群的技术和基于虚拟机重启的技术。 该解决方案提供了一个简单的部署模型,该模型使用控制器系统(称为KSYS)来监视整个虚拟机环境。 该解决方案还提供了灵活的故障转移策略和存储复制管理。

    您可以在IBMdeveloperWorks®Wiki文档上了解有关Power Systems的地理分散弹性的更多信息: 为什么GDR是Power Systems和FAQ 的理想DR解决方案 。

    每隔几年,硬件系统都会经历一次升级周期,以满足不断增长的业务需求,例如更多的客户,增加的流量,与高容量新服务器的整合等。 本文介绍了使用地理分散弹性的电源系统进行计划的硬件升级的优势,然后详细介绍了执行升级的步骤。 请注意,本文讨论的硬件升级范围是针对主机中央处理器复合体(CPC),而不是针对存储区域网络(SAN)上的存储升级。

    在深入研究技术,优势和步骤之前,我们将概述IBM Power Systems的地理分散型弹性中使用的关键术语。 如果您熟悉我们的文档和以前的文章中的内容,则可以跳过本节。

    KSYS :KSYS是逻辑分区(LPAR),当前是IBMAIX®LPAR,在其中部署了地理分散的弹性软件。 KSYS充当协调器,用于监视,管理虚拟机并将其从一个站点移动到另一个站点。 KSYS代表C(K)ontroller系统LPAR。 使用ksysmgr命令以以下格式配置ksysmgr : ksysmgr ACTION CLASS [NAME] [ATTRIBUTES...] 站点 :这是一个逻辑名称,代表主站点或活动站点以及灾难恢复或备份站点。 站点必须在KSYS级别上创建。 所有硬件管理控制台(HMC),主机,虚拟I / O服务器(VIOS)实例和存储设备都映射到一个站点。 网站可以是以下两种类型: 活动站点(或主站点):这是指在特定时间运行工作负载的当前站点。 备份站点(或灾难恢复站点):这是指在特定时间充当工作负载备份的站点。 在灾难或潜在灾难期间,工作负载将移至备份站点。 主机 :主机是HMC中的受管系统,主要用于运行工作负载。 主机由其在HMC中跟踪的通用唯一标识符(UUID)标识。 主机对表示在站点之间配对以实现高可用性和灾难恢复的一组主机。 虚拟机:虚拟机(也称为逻辑分区)与特定的VIOS分区关联,用于虚拟化存储来运行工作负载。 一个主机可以包含多个虚拟机。 存储代理 :灾难恢复解决方案需要有组织的存储管理,因为存储是任何数据中心中至关重要的实体。 GDR解决方案依赖于从活动站点到备份站点的数据复制。 在GDR解决方案中,通过使用存储复制将数据从活动站点复制到备份站点。 站点发现 :完成初始配置后,KSYS节点将发现主站点和备份站点中由HMC管理的所有主机,并显示状态。 发现期间,KSYS节点监视所选站点内所有受管主机中所有LPAR或VM的发现。 KSYS节点收集每个LPAR的配置信息,并显示状态。 KSYS节点发现每个VM的磁盘,并检查当前是否已将VM配置为用于存储设备的镜像。 站点验证 :在验证阶段,KSYS节点从HMC中获取信息,以检查备份站点在灾难期间是否能够承载VM。 KSYS节点还验证与存储复制相关的详细信息。 灾难恢复 :在验证阶段之后,KSYS节点将继续监视活动站点,以查看站点中任何资源中的任何故障或问题。 如果发生计划内或计划外的中断,并且如果情况需要进行灾难恢复,则必须使用ksysmgr命令将虚拟机移动到备份站点,以手动启动恢复。 计划的灾难恢复 :计划的移动是一项操作,管理员可以在没有灾难事件且活动站点中的资源可以正常关闭的情况下启动移动。 启动这些类型的操作主要是为了执行DR测试演练,从一个站点移动到另一个站点,或者当其中一个站点需要脱机进行维护时。 计划外的灾难恢复 :在计划外的灾难恢复场景中,诸如电源故障之类的灾难使活动站点瘫痪,无法再从备份站点进行访问。 在这种情况下,需要在备份站点上启动VM,并使软件堆栈重新联机以恢复业务应用程序。 由于灾难使活动站点崩溃,因此活动站点中的资源不再可访问,并且不能通过地理分散弹性(KSYS)自动释放回企业池中。 活动站点启动后,管理员可以使用KSYS手动启动对活动站点VM的清理。

    典型的计划硬件升级

    重要的是要弄清如何耗时且繁琐的计划硬件升级周期才能体现出在地理位置分散的弹性下进行相同操作的价值主张。 有多种方法可用,但是通常从使用实时分区移动性(LPM)的选项开始。 但是,如果灾难袭击了LPM的生产站点,则将无法使用地理分散的弹性来恢复虚拟机,因为地理分散的弹性需要成对的主机才能在备份站点上恢复虚拟机。 由于LPM会限制一定的距离,网络和存储配置,因此,如果生产站点和备份站点之间的距离更长并且VM需要关闭以进行数据中心的计划维护活动或整个数据中心更换,您可以使用地理分散弹性将虚拟机移至备份站点,并在维护完成后将其移回到生产站点。

    使用地理位置分散的弹性来计划硬件升级

    如果您的环境启用了地理分散的弹性来获取GDR的好处,如我们之前的文章所述,例如使用IBM地理分散的弹性解决方案为Power Systems提供的 GDR和业务连续性和灾难恢复即服务(DRaaS)产品介绍,则硬件升级也将大大简化。 该技术很简单,包括以下步骤:

    从生产站点到备份站点调用计划的灾难恢复。 取消配对主站点和备份站点。 替换/升级生产站点主机。 将备份站点与新的生产站点主机配对。 从备份站点到生产站点调用计划的灾难恢复。
    图1.执行计划的硬件升级的步骤

    演练步骤

    让我们举一个典型的例子,我们想将主机CPC /托管系统从IBMPOWER7®替换为IBMPOWER8®。 确保ksyscluster是调用使用有计划的灾难恢复和守护进程之前主动ksys有效。

    运行以下命令以检查ksyscluster的状态: ksysmgr query cluster
    图2. ksysmgr查询集群输出
    运行以下命令以检查KSYS使用的IBM.VMR守护程序: lssrc -s "IBM.VMR"
    图3.检查IBM.VMR状态的命令
    使用以下命令检查当前站点和主机配置: ksysmgr query site
    图4. ksysmgr查询站点输出
    图5. ksysmgr查询主机输出
    从活动站点到备份站点调用计划的灾难恢复。 在本文中,我们将调用从奥斯汀到印度的计划中的灾难恢复。

    运行以下命令:

    ksysmgr -t move site from=<active site> to=<backup site> dr_type=planned
    图6.调用DR的命令
    运行以下命令以取消对现有主机对的配对: ksysmgr pair host <active site hostname> pair=none
    图7.使用ksysmgr配对两个主机的命令
    运行以下命令以检查主机是否未配对: ksysmgr query host
    图8. ksysmgr查询主机输出
    取消配对后, 配对字段显示为无 。 使用以下命令将新的主机/受管系统添加到升级的级别/版本: ksysmgr add host hostname site=<site name>
    图9.将主机添加到KSYS配置的命令
    使用以下命令删除主机/受管系统的较旧级别/版本: ksysmgr remove host hostname
    图10.从KSYS配置中删除主机的命令
    将新添加的主机/托管系统与现有主机/托管系统配对,然后确保从当前活动站点主机到备份站点主机进行了配对。
    图11.查询站点的命令
    运行以下命令以将活动站点主机与备份站点主机配对: ksysmgr pair host <active site hostname > pair=<backup site hostname>
    图12.使用ksysmgr配对主机的命令
    检查主机配置,以确保活动站点和备份站点都已配对。
    图13.在KSYS配置中查询主机/受管系统的命令
    从当前备份站点到生产站点调用计划的灾难恢复。 发现当前活动站点,验证该站点,然后调用计划的灾难恢复。 请注意,在配对新主机时,默认情况下,KSYS旨在发现主机中的所有VM。 如果新配对的主机上或当前主机上没有其他以前由KSYS管理的VM,则需要使用ksys命令对其进行ksys管理: ksysmgr unamange vm name=<VM name> host=<hostname> 使用以下命令发现当前活动站点: ksysmgr -t discover site <active site name>
    图14.使用ksysmgr发现活动站点的命令
    使用以下命令来验证当前活动站点: ksysmgr -t verify site <active site name>
    图15.使用ksysmgr验证活动站点的命令
    使用以下命令来调用计划的DR: ksysmgr -t move site from=<active site> to=<backup site> dr_type=planned
    图16.使用ksysmgr调用DR的命令

    现在,虚拟机正在原始生产站点上运行,该站点具有升级的受管系统/ CPC。

    结论

    除了高可用性的核心价值主张外,地理分散的弹性还有助于简化方法来执行计划的硬件升级,而停机时间却大大减少。

    翻译自: https://www.ibm.com/developerworks/aix/library/au-aix-hardware-upgrade/index.html

    相关资源:IBM Power System S812L 和S822L
    Processed: 0.018, SQL: 10