VMware vCenter 高可用性 HA 详解

HA的全称是High Availability(高可用性)。VMware HA群集一般具有一个包括两个或者两个以上ESX主机的逻辑队列。在一个HA群集中,每一台VMware ESX服务器配有一个HA代理,持续不断地检测群集中其他主的心跳信号。假如某台ESX主机在连续三个时间间隔后都还没有发出心跳信号,那么该主机就被默认为发生了故障或者与网络的连接出现了问题。

在这种情况下,原本在该主机上运行的虚拟机就会自动被转移到群集中的其他主机上。反之,如果一台主机无法接收到来自群集的其他主机的心跳信号,那么该主机便会启动一个内部进程来检测自己跟群集中其他主机的连接是否出现了问题。如果真的出现了问题,那么就会中断在这台主机上所有正在运行的虚拟机,并启动预先设定好的备用主机。

此外,VMware HA的另一个显著的特点是能够对一个群集中的多台ESX服务器(多达四台)上进行故障转移。对于一次VMware HA故障转移,客户端操作系统认为只是一次因硬件的崩溃而进行的重启,并不会觉察到是一次有序的关机。因此,这样的修复并不会改变操作系统的状态。此外,虚拟机中任何正在进行的业务也不会丢失。即使备用ESX服务器主机的硬件设备跟原ESX服务器主机的硬件设备有所不同,客户端操作系统也不会检测到这种不同。所以,VMware HA的故障转移对于客户来说可以算是完全透明的,几乎不会出现任何停机的危险。

 

VMware HA 提供快速中断恢复

VMware HA 利用配置为群集的多台 ESX/ESXi 主机,为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。

 
VMware HA 通过以下两种方式保护应用程序可用性:
1. 通过在群集内的其他主机上自动重新启动虚拟机,防止服务器故障。
2.  通过持续监控虚拟机并在检测到故障时对其进行重新设置,防止应用程序故障。与其他群集解决方案不同,VMware HA 提供基础架构并使用该基础架构保护所有工作负载:不需要在应用程序或虚拟机内安装任何特殊软件。所有工作负载均受 VMware HA 保护。配置 VMware HA之后,不需要执行操作即可保护新虚拟机。它们会自动受到保护。
3. VMware HA 与 VMware Distributed Resource Scheduler (DRS) 结合使用,不仅可以防止故障发生,而且可以在群集内的主机之间提供负载平衡。

 
与传统的故障切换解决方案相比,VMware HA 具有多个优势:
1. 最小化设置 设置 VMware HA 群集之后,群集内的所有虚拟机无需额外配置即可获得故障切换支持。
2. 减少了硬件成本和设置 虚拟机可充当应用程序的移动容器,可在主机之间移动。管理员会避免在多台计算机上进行重复配置。使用 VMware HA 时,必须拥有足够的资源来对要通过VMware HA 保护的主机数进行故障切换。但是,vCenter Server 系统会自动管理资源并配置群集。
3. 提高了应用程序的可用性 虚拟机内运行的任何应用程序的可用性变得更高。虚拟机可以从硬件故障中恢复,提高了在引导周期内启动的所有应用程序的可用性,而且没有额外的计算需求,即使该应用程序本身不是群集应用程序也一样。通过监控和响应 VMwareTools 检测信号并重置未响应的虚拟机,还可防止客户机操作系统崩溃。
4. DRS 和 VMotion 集成 如果主机发生了故障,并且在其他主机上重新启动了虚拟机,则 DRS 会提出迁移建议或迁移虚拟机以平衡资源分配。如果迁移的源主机和目标主机中的一台或者两台发生故障,则 VMware HA 会帮助从该故障中恢复。