Split-brain
High-availability 集群正常运作时,只应有一台主机作为活动服务器。无源服务器会通过 Heartbeat 和集群连接来检测活动服务器。
可以设置多个路径以将主机连接到数据网络来实现冗余,但如果 Heartbeat 连接和主集群连接发生故障,则两台服务器都可能尝试承担活动服务器的角色,并导致“split-brain”错误。在此情况下,至 high-availability 集群的 IP 地址的连接将被重新导向到两台服务器之一,两台服务器上更新或写入的数据可能不一致。当其中一台重新连接后,系统将检测 split-error 和两台主机之间的数据不一致。
注:
- 如果不确定向每个网络接口分配的角色(集群还是 Heartbeat),则可以进入 Synology High Availability > 网络进行检查。
当发生 split-brain 错误时:
- 两台服务器上的服务和 high-availability 集群的 IP 地址在 split-brain 错误解决之前无法使用。
- 遇到这类错误状态时,会在左侧面板中出现名为 Split-brain 的新选项卡。在此选项卡中将列出以下信息:两台服务器上共享文件夹中文件之间的差异、服务器成为活动服务器的时间以及上次 iSCSI Target 连接信息。
- File Station 将处于只读模式,但您仍可下载或查看文件。
- 在集群选项卡中,可以通过单击管理按钮来关闭集群或解决 split-brain 错误。有三个选项可用于解决错误:
- 在集群中保留两台服务器:选择其中一台主机作为新的活动服务器,系统会在重新启动两台服务器之后,将新的活动服务器上的数据和设置同步到新的无源服务器。 注:如果选择此选项,则在 split-brain 期间对无源服务器进行的更改会丢失。
- 在集群中保留一台服务器:选择一台主机作为新的活动服务器,而移除另一台主机。系统重新启动主机之后,新的活动服务器仍处于集群中,而移除的主机会保留其数据并恢复为独立状态。在您下次添加无源服务器时,需要执行完整数据同步。
- 移除整个集群:移除集群并保留主机上的数据。两台主机都会恢复为独立状态。
注:
- 共享文件夹中的文件越多,列出差异所需的时间越长。
- 解决错误时,确认两台主机都已开机,然后再选择新的活动服务器。