你在这里: 管理员指南 > 规划FME服务器安装 > 系统架构 > 容错规划

容错规划

容错或“高可用性”对于任何成功的业务运营至关重要。为了确保在发生故障时处理请求,FME服务器支持在整个集成系统的多个级别中配置容错公差。FME服务器通过以下方式提供容错性:

  • 复苏:发生崩溃时重新启动组件和作业。FME服务器自动提供组件和任务恢复-不需要额外的计划。
  • 故障转移:确保不存在单点故障。可以使用两种不同的配置来实现这一点:Active/Passive或Active/Active。对于决定要实现的安装体系结构类型,故障转移是首要考虑因素。

对经济复苏

组件恢复

FME服务器带有组件恢复功能。这意味着,即使在单个系统上,FME服务器也会监视和重启失败的组件,包括FME引擎和FME服务器核心。这是通过FME服务器进程监视器.FME服务器监控自己组件的能力确保了可靠的正常运行时间和可靠性。

工作恢复

FME服务器还包括在崩溃发生时重新启动翻译(作业)的能力。FME服务器将继续重新提交翻译,尝试次数不超过指定的次数。因此,遇到临时问题(如网络中断)的作业将重新提交并再次运行。作业恢复是可配置的,可以完全关闭。有关更多信息,请参见工作恢复

注意:重新提交的作业可能会导致数据重复,比如写入数据库格式时。

关于故障转移

故障转移环境的目标是消除单点故障,以便组件可以发生故障,但不会使系统脱机。FME Server支持两种故障转移方式:主动被动active - active

我们通常推荐主动/被动体系结构,它满足大多数企业的需求。两种方法都有优点和缺点。

主动被动

使用Active-Passive故障转移方法,当Active系统发生故障时,被动系统将接管失效的Active系统的功能,并承担Active系统的角色。而失败的系统则采用被动模式。当新的Active系统继续提供FME服务器的操作时,可以对失败的系统进行调查。一旦被动系统恢复,它将保持此角色,直到主系统上发生另一个故障。

故障转移是通过Active和Passive系统之间的心跳监视器实现的。通常导致故障转移的故障类型是硬件或操作系统崩溃,其中主要系统完全宕机。

重新提交故障转移时丢失的任何翻译。这些包括由于托管FME引擎的机器上的电源而失败的作业,以及完成的工作,但由于托管FME服务器核心的机器上的电源丢失,仍被认为丢失。

在主动被动架构中,FME服务器Web应用程序服务器和FME服务器系统共享文件物理上分开。必须由客户端提供这些组件的容错。有关更多信息,请参见主动-被动架构

主被动的优点

  • 发布工作区是整个系统的一次性任务。
  • 作业恢复内置于容错设计。

主被动的缺点

  • 需要多个物理或虚拟系统,因为每个组件及其故障转移都在不同的系统上。也就是说,至少两个FME服务器核心系统,以及Web应用程序服务器,数据库和文件系统的单独系统。

active - active

主动活动故障转移架构在单独的服务器上重复完整的FME服务器安装。换句话说,所有组件都驻留在同一系统上,并且其他系统配置类似地配置并提供类似的功能。第三方负载均衡器将传入流量指向其中一个可用系统。当请求被引导到任何系统时,它们独立处理,只能由一个系统处理。这种方法适用于基于云的计算环境,例如亚马逊Web服务,其中可以轻松克隆机器以扩展容量。

有关更多信息,请参见active - active架构

active - active的优点

  • 容易安装使用快速安装选项。
  • 创建容错环境所需的机器更少。
  • 通过添加更多的系统可以轻松地实现额外的吞吐量。

主动活性的缺点

  • 需要管理多个FME服务器。
  • 工作空间必须发布到每个系统,手动或通过脚本,以保持父和子项同步。
  • 没有内在的工作恢复。在系统上运行失败的任何翻译都会丢失,直到系统恢复联机,或者必须在另一个系统上手动重新提交。
  • 当系统出现故障时,处理能力会降低。
  • 可能仍然需要整个环境的FME服务器系统共享的恢复/复制。
  • 计划不会故障转移;必须在另一个系统上手动重新启动它们。