span8
span4
FME Cloud附带了一套很棒的工具,允许用户根据可能影响FME Cloud实例的正常运行时间和性能的特定条件轻松设置警报。但在此之前创建警报和配置通知我们需要了解警报所基于的指标。这些指标在创建警报时可见,或者在选中实例的实例页上的Monitoring选项卡下可见。
FME Server的内存消耗在很大程度上取决于底层工作空间和所使用的变压器。内存使用指标是查看FME云实例是否出现问题的第一个指标。内存不足是导致FME云实例无响应的最常见原因之一。有些作业可能会非常突然地失败,日志文件可能没有您正在寻找的信息。这个指标还可以帮助调查工作失败。在查看内存使用情况时要记住的一件事是,当内存不足时,可能还需要检查临时磁盘使用情况。当实例耗尽内存时,一些翻译将写入临时磁盘。
主盘包含FME服务器安装、发布到FME服务器的数据和PostgreSQL数据库。我们强烈建议密切关注这个指标,并为主磁盘使用情况设置一个警报。当主磁盘已满时,Web Application服务器可能会关闭,即使在实例重新启动后也无法正确启动。通常,恢复的唯一方法是回滚到以前的备份。这就是为什么主磁盘使用警报(10分钟内90%的使用率)是一个非常重要的警报,并且默认为所有实例启用。防止磁盘空间耗尽的另一个非常有用的工具是FME服务器系统清理.
该磁盘映射到FME服务器上的Temp资源文件夹。当实例暂停且没有备份时,它将被擦除。当实例的内存不足并开始写临时数据时,这种临时磁盘使用也会增加。当在临时磁盘使用中发现不寻常的模式时,建议始终检查内存使用情况。一定要看看这个关于临时磁盘的文章.
FME服务器引擎数可以通过FME服务器的web用户界面进行设置。发动机计数高于初始设置可能有不同的原因。根据您的工作流,可以通过使用FMES亚搏在线erverJobSubmitter的作业启动其他引擎。如果出现的引擎数量高于预期,那么可能存在问题。特别注意是否有发动机启动和不再关闭的模式。你需要调查一下这个问题。如果预期引擎计数是常量,那么设置一个警报以在指标发生变化时立即通知非常有用。
网络吞吐量度量允许您以每秒千字节为单位监视FME Cloud实例的输入和输出。如果您在FME上实现了允许客户端上传和下载数据的解决方案,那么这对于检测任何异常行为都非常有用。
此指标指向FME服务器运行状况检查页面。较高的数字可能表明服务器负载过重,对请求的响应比通常要慢。如果在10分钟或更长时间内响应时间超过500毫秒,则应该查看实例并检查其他指标,如服务器负载或内存,以查看实例是否处于挣扎状态。
高服务器负载通常伴随着高内存利用率。此外,您运行的引擎越多,服务器负载就会越高。为了正确地解释服务器负载并为您的警报设置一个足够的阈值,理解服务器负载指标及其与您的FME云实例的核心数相关的含义是很重要的。负载为1.0意味着一个核心的利用率为100%。我们的FME Cloud Starter实例有2核,因此2.0的负载表明2核的充分利用。假设你最近在一个标准大小的实例(4核和16 GB ram)上增加了引擎,并想确保你的FME Cloud实例能够处理它。在这种情况下,您应该将警报设置为在负载超过2.8时触发,这相当于4个核心的70%利用率,持续时间超过30分钟。
©2020 S亚搏在线afe Software Inc |法律