第8页
第4排
FME云提供了一套很好的工具,允许用户根据可能影响FME云实例正常运行时间和性能的特定条件轻松设置警报。但在我们能做到之前创建警报和配置通知 我们需要了解警报所依据的指标。当创建警报或在实例页上的监视选项卡下选择实例时,这些指标可见。
FME服务器的内存消耗很大程度上取决于底层工作空间和使用的变压器。内存使用度量是查看FME云实例是否有问题的第一个度量。内存不足是导致失效的FME云实例最常见的原因之一。某些作业可能会突然失败,日志文件可能没有您要查找的信息。该指标还可以帮助调查作业失败情况。在查看内存使用情况时要记住的一点是,当内存不足时,可能还需要检查临时磁盘使用情况。当实例耗尽内存时,一些转换将写入临时磁盘。
主磁盘包含FME服务器安装,发布到FME服务器和PostgreSQL数据库的数据。我们绝对建议密切关注这个指标,并针对主要磁盘使用情况设置警报。当主磁盘已满时,即使在实例重新启动之后,Web应用程序服务器也可能会关闭并无法正确启动。通常恢复的唯一方法是回滚到以前的备份。这就是为什么主磁盘使用率警报(超过10分钟的90%使用率)是一个非常重要的警报,并且默认情况下为所有实例启用。另一个防止磁盘空间耗尽的非常有用的工具是FME服务器系统清理.
此磁盘映射到FME服务器上的临时资源文件夹。当实例暂停且未备份时,它将被擦除。当实例内存不足并开始写出临时数据时,这种临时磁盘使用率也会增加。当临时磁盘使用中出现异常模式时,建议始终检查内存使用情况。一定要检查这个关于临时磁盘的文章.
可以通过FME服务器的Web用户界面设置FME服务器引擎计数。比最初设置的发动机计数高可能有不同的原因。根据您的工作流程,亚搏在线使用fmeserverjobsubmitter可以通过作业启动其他引擎。如果出现更高数量的引擎,那么您将在度量中看到,可能有问题。如果有发动机起动和不再停机的模式,请特别注意。你需要调查一下这个问题。如果需要恒定的引擎计数,设置警报以在指标更改时立即通知非常有用。
网络吞吐量度量允许您以每秒千字节为单位监视FME云实例的输入和输出。如果您在FME上实现了一个允许客户上传和下载数据的解决方案,这对于检测任何异常行为都非常有用。
该指标指向FME服务器健康检查页面。较高的数字可能表示服务器负载过重,对请求的响应速度比平时慢。如果您在10分钟或更长时间内遇到超过500 ms的响应时间,您应该查看实例并检查其他指标,如服务器负载或内存,以查看实例是否在挣扎。
高服务器负载通常与高内存利用率结合在一起。也,你运行的引擎越多,服务器负载越高。要正确解释服务器负载并为警报设置足够的阈值,了解服务器负载度量及其对FME云实例核心数量的影响是很重要的。1.0的负载意味着1个核心的100%利用率。我们的FME Cloud Starter实例有2个核心,因此负载为2.0表示2个核心的充分利用率。因此,假设您最近在标准大小的实例(4核和16 GB RAM)上增加了引擎,并希望确保您的FME云实例能够处理它。在这种情况下,应将警报设置为当负载超过2.8时触发。相当于4核70%的利用率,超过30分钟。
?2019安全亚搏在线软件公司|法律