切换/自动故障转移
为确保连续执行和尽量减少服务停机,服务可以从 high-availability 集群的活动服务器切换至冗余的无源服务器。该功能称为“切换”,在某些情况下称为“故障转移”。此章节说明这两个概念的基础。
切换
转移是指从 high-availability 集群的活动服务器到冗余服务器 - 无源服务器的切换。正常情况下,活动服务器管理所有服务。但如果活动服务器发生故障,在无源服务器正常运行的前提下,您可启动切换,将所有服务转移至无源服务器。这种情况下,活动服务器成为无源服务器,无源服务器则成为活动服务器。
若要手动启动切换:
- 在集群页面中单击管理按钮
- 单击切换
注:
- 切换功能启动时,活动服务器会先切换为无源服务器,然后无源服务器才会切换为活动服务器。因此,切换过程间会有短暂时间,两台服务器都是无源服务器,且无法正常提供服务。完成切换的时间取决于存储空间或 iSCSI LUN(块级)的数量和大小,或是 high-availability 集群上服务的数量和总负载。
自动故障转移
发生某些错误时,系统可以自动启动服务切换以保持连续运行。这情况称为“故障转移”。在下列情况下,系统可能启动故障转移:
- 存储空间损毁:活动服务器上的存储空间(例如存储空间、硬盘组、RAID Group、SSD 缓存等)已损毁,但无源服务器上相应的存储空间运行正常。请注意,如果已损毁的存储空间上没有存储空间或 iSCSI LUN(块级),则系统不会启动故障转移。
- 服务错误:监控的服务出现错误。
- 电源故障:活动服务器关闭或重启;活动服务器的两个电源设备出现故障;或断电。
切换失败
在下列情况下,切换或故障转移可能失败:
- 数据复制不完整:当首次组合两台服务器创建 high-availability 集群时,系统需要时间将所有数据从活动服务器复制到无源服务器。
- 无源服务器上的存储空间损毁:无源服务器上的存储空间(例如存储空间、硬盘组、RAID Group 等)已损毁。
- 电源故障:无源服务器关闭或重启;无源服务器的两个电源设备出现故障;或断电。
- DSM 更新:安装 DSM 更新时,所有的服务都将停止,并在 DSM 更新安装完成后恢复。
如果手动启动切换,但是无法将服务切换至无源服务器,则系统将尝试将服务切换回活动服务器。
如果启动了故障转移,但由于错误,任一台服务器都无法成为活动服务器时,high-availability 集群将无法正常提供服务。如果服务器没有自动恢复为独立状态,请按两台服务器上的重置按钮,恢复默认设置。一旦恢复默认设置,您可以组合服务器并再次创建 high-availability 集群。
不间断电源
High-availability 集群可连接至不间断电源 (UPS) 设备以减少意外断电的风险。如果断电,系统将从连接的任何 UPS 设备获得备用电源。当连接到活动服务器的 UPS 设备开始以低电量运行时,系统将尝试将服务切换至无源服务器。请参看以下说明。
- 如果活动和无源服务器均连接到同一网络交换机,我们建议将这两台服务器连接到与网络交换机相同的电源中。
- 如果活动和无源服务器连接到使用不同电源的不同网络交换机(例如来自不同电厂的电源),我们建议将这两台服务器连接到与其连接的网络交换机相同的电源。
- 如果活动和无源服务器连接到使用不同 UPS 设备的不同网络交换机,建议将这两台服务器均连接到其中一台 UPS 设备而不是不同的 UPS 设备。当 UPS 设备停电后,活动服务器将收到通知并进入安全模式,而无源服务器将适时关机。如果这两台服务器连接到不同的 UPS 设备,则活动服务器将无法检测到无源服务器的 UPS 是否在以低电量运行,因此无源服务器可能意外关机。
注:
- Synology NAS 支持连接到本地和 SNMP UPS 设备。要了解更多信息,请参见控制面板 > 硬盘 > UPS 的帮助