主题“统计”中的问题

基于属性值汇总不同类型线段的长度

考拉18 — FRI，2019年1月25日格林尼治标准时间21:15:39

你好，我想根据图号总结每种路线类型的长度。例如，在地图第000号，它将给出程序1的总长度，项目2和岛屿和转弯车道。我的读者是一个在线专题班，我还有单独的映射索引类。理想的，我想为相关的地图编号提供有关每种路线类型的距离的属性。我试过取样器，statisticscalculator（静态计数器）聚合器等等，他们没有给出我想要的结果。也许有什么背景或其他变形金刚我可以尝试？谢谢您。

FME服务器自定义翻译消息

马德沃伦 — 清华大学，2019年1月24日15:22:53格林尼治标准时间

添加在翻译成功或失败后在FME服务器Web界面上添加自定义翻译消息的功能。在FME桌面上，我使用启动/关闭脚本来解析日志文件，并收集弹出窗口显示用户信息的统计信息。如果能够在最终用户运行工作区后直接将此信息添加到页面中，那就太好了。

FME云，Python和R

半导体激光器 — 清华大学，2018年12月20日16:12:25格林尼治标准时间

我希望生成盖蒂斯在FME云上托管的工作台中进行统计。

我相信这可以通过一辆卡车来实现，或者打电话给Python软件包.

是否可以安装R，或者非内置的python包在一个托管在FME云中的FME服务器实例上？

计算对象中的几何图形部分总数

杰罗恩 — 周一，2018年11月26日08:02:55格林尼治标准时间

我正在构建一个流程，该流程需要几何图形功能中（外部）部分的总量。我需要从一个（因此是1）或多个（2+）特征中得到的部分总数，以便进行进一步的统计分析。为了得到这个，我使用了partcounter，它会给我返回几何体中零件数的partcounter。对于多组和集料，这是零件的数量，至于路径，这是段数。否则，就是一个。

我希望，在单个功能（甜甜圈）上使用此功能时。它将返回值1，但在附加的示例中，还有我试过的其他甜甜圈，它返回甜甜圈的总量+外部零件的总量。

是否可以在不使用内部边界的情况下使用另一个变压器来获取部件计数，而不需要使用Donuholefilter来填充Donutsholes？或者只是计算一下外部边界部分？

填充甜甜圈非常耗时且占用CPU（例如，对于10000个对象，但也可以处理带有x百万的集合，这将需要几个小时的额外时间）：

28.6秒。（CPU:27.3s用户，1.0s系统）对1分51.8秒。（CPU:63.4s用户，22.6S系统

简而言之，问题是：

获取值51，但希望值1（1个对象，不是内外边界）。非En2NO.FMWT

FME工作区统计信息（您可以提供帮助！）

标记安全亚搏在线 — 星期二，2018年11月20日20:08:47格林威治标准时间

FME工作区统计介绍

工作区统计信息有助于您了解以及你组织中的其他人，正在使用FME。这将允许您：

将组织培训重点放在常用功能（格式或变形金刚）上。
跟随最佳实践关于如何在组织内以统一的方式构建和结构工作区。
帮助记录工作区。
确定可能改进的工作区，包括可以更新的变压器。
通过了解哪些变压器可以更新，制定更全面的升级计划。
帮助安全了亚搏在线解您的FME使用，以便我们能够适当地改进FME产品。亚搏在线娱乐平台

附件是一个工作区，它将读取一个或多个工作区，并生成包含各种工作区统计信息的Excel电子表格，包括：

每个读写器格式和变压器的汇总统计（包括变压器中的读写器）
每个工作区的汇总统计信息（读卡器/写卡器/变压器等的数量）
列出变压器版本并将其与当前版本的FME的变压器版本进行比较。
每个工作区的详细统计信息（可选）
具有频率计数的变压器之间的连接

输出为Excel电子表格，包含以下表格：

标题：有关此分析的一般信息。
工作区摘要：每个工作区的摘要统计信息，包括上次保存的内部版本号。工作区名称可以混淆。
读者/作者摘要：这些为所有工作区的所有读写器提供格式计数，包括《变形金刚》中的读者和作家，如《壮志凌云》。第二对工作表具有格式系列（即Oracle包括Oracle Spatial，Oracle非空间等）。
变压器汇总：统计每个变压器（以及可选的自定义变压器）。包括工作区中遇到的变压器版本列表和当前变压器版本-这可以帮助您确定是否值得更新某些变压器。嵌入式定制变压器的内容将包含在分析中。链接的自定义变压器不包含其内容，除非包含*.fmx文件。
连接摘要：这显示变压器（或读写器）与其频率之间的从到连接的摘要。
按工作区列出的读卡器/写卡器/变压器（可选）-按工作区显示功能细分（工作区名称模糊）。

下载

文件复制工作区：文件复制工作区.fmw（运行于2018.0或更高版本）

统计工作区：工作区统计.fmw（运行于2018.0或更高版本）

示例结果：WorkspaceStatistics_webinars.zip（工作区统计）

如果对工作区进行了任何更改，或者发现问题，请在这里分享您的变化和想法，以便每个人都能受益。

分享你的结果

请与我们分享您的结果fmestats@亚搏在线safe.com公司-这将帮助我们确定哪些格式和变压器对FME用户更重要。请区分桌面分析和FME服务器存储库分析。

如果您有敏感项目（推荐），统计工作区允许您混淆工作区名称（可选）。您也可以选择忽略自定义变压器（如果这些变压器是敏感的）。我们将合并来自所有用户的结果并在此处发布它们。

如何使用

运行统计工作区（工作区统计.fmw）：指向包含工作区的目录（或指向包含工作区的一组目录的根目录）。然后，统计信息工作区将获得它找到的所有工作区和/或自定义转换器的统计信息。

指向一个目录更有效，而不是扫描系统上的所有目录（这可能非常慢）。为了帮助解决这个问题，我们还提供了另一个工作区（文件复制工作区.fmw）这将通过将一组文件夹中的所有.fmw/.fmx文件复制到一个目录中来创建工作区目录。如果读取无效或损坏的工作区，工作区读卡器（FMW）可能会失败-这就是为什么最好将所有工作区复制到一个文件夹中，然后删除或调查问题工作区。

文件拷贝

分两步运行filecopyworkspace.fmw。

启用路径读取器并使用文件浏览器指向“根”目录。文件和目录路径读取器将扫描此根文件夹下的所有目录，并创建FME工作区的目录。编辑目录以删除任何重复的工作区，等。
禁用路径读取器并启用Excel读取器。工作区将读取工作区目录，并将所有工作区复制到一个公用文件夹中。

统计信息工作区

输入提示：

你的名字，组织，注释（所有可选）
隐藏工作区名称：如果希望隐藏工作区名称，请选择“是”。
这是一个FME服务器存储库吗？是否这将帮助我们了解一点FME服务器的使用。
包括禁用对象：是否
包括工作区详细统计：是否。如果不希望共享单个工作区的详细信息，请设置为“否”。
包括定制变压器：是否
源FME工作区目录。使用 选择多个文件夹/文件浏览器如果跳过文件副本并打算扫描多个文件夹。
目标Microsoft Excel文件。Excel报表位置。

使用说明

尽量避免创建工作区版本的统计信息，即工作区v01.fmw，工作区v02.fmw
如果您使用FME 2019，那么您还可以读取FME模板文件（*.fmwt）。如果您使用的是FME 2018，则必须解压缩FME模板文件。使用winzip wzunzip（或类似的应用程序）执行此操作。您可以在命令行上执行：wzunzip*.fmwt你将得到所有的内容（data+.fmw），但你将能够清理
请指出这些统计数据是否用于FME服务器存储库（否则，我们将假定它们是桌面统计数据）。通常，在FME服务器中，工作空间位于存储库文件夹中，这是文件共享，不是安装文件夹，即C:\ProgramData\亚搏在线安全软件\FME服务器\存储库\其中C:\ProgramData\
如果您使用FME 2019，那么您还可以读取FME模板（*.fmwt）文件。

结果

读写器计数。如果同一工作区有多个读写器-在读写器摘要统计中，这将被视为一个读写器。
连接摘要：所有读卡器功能类型与所有编写器功能类型之间的连接都计为单个连接-读卡器到编写器。
摘要连接跳过交叉点和“隧道”。

常见问题解答

使用统计有什么不同？
安装FME时，您可以选择向我们发送使用统计信息。这给了我们一张你要添加到你的工作区的格式和变形金刚的图片。但有些工作空间很少被编辑，它们只是运行——尤其是那些您可能在生产服务器上拥有的工作区。我们认为这些工作区可能是您拥有的最重要的工作区，我们无法获取它们的统计数据。
变压器连接
上有更多变压器连接可用变压器廊道.

分析

我们已经运行了工作区统计数据，例如在安全的网络研讨会中使用的工作区，以说明所附的结果。亚搏在线

附件

文件复制工作区：文件复制工作区.fmw（运行于2018.0或更高版本）

统计工作区：工作区统计.fmw（运行于2018.0或更高版本）

示例结果：WorkspaceStatistics_webinars.zip（工作区统计）

如果对工作区进行了任何更改，或者发现问题，请在这里分享您的变化和想法，以便每个人都能受益。

python调用程序内部的统计信息

艺术 — 星期二，2018年11月13日22:36:05格林威治标准时间

你好，

我想读取一些特定字段的所有属性，然后计算一些讽刺。

我知道使用多个统计计算器和功能合并是可能的。

如何在Python调用程序内执行此操作？

谢谢

控制基本日志记录

HSAMOR公司 — 周一，2018年10月15日12:10:00格林尼治标准时间

我只想配置一个小的日志文件，声明来自我工作区的几个连接（管道）的相同计数。让我们调用检查点。

是否有比在每个检查点添加计数器/分拣机/取样器或统计计算器更好的方法？

统计计算器有点过分杀伤力，我想。

如果没有，我的伤口就像一个新的微型变压器，只不过是为了保护计数不受管道的影响，所以我可以命名每个检查点并将它们收集到一个文件中。
必须有一种方法可以重复使用每根管道的数量，以一种简单的方式，正确的？

FME云数据传输和存储度量

尼克朗 — 星期二，2018年8月7日格林尼治标准时间22:50:11

由于数据存储和传输成本是除FME云实例成本之外的费用，随着时间的推移，跟踪使用情况会很方便。当前的计费仪表板提供了月份到日期的指标，但如果能够看到每天的传输和存储使用情况（以KB/MB/GB为单位，而不是-或除此之外-美元）。这些信息可以显示在图形或表格中。

有关详细信息，请参阅此问题：

https://knowledge.亚搏在线safe.com/questions/75739/fme-cloud-data-transfer-statistics-reporting.html网站

从工作区获取特殊变量并在日志文件中添加值

利奥诺拉诺夫 — 清华大学，2018年5月24日14:22:28格林尼治标准时间

你好，

我在一个工作区工作，那里有多个变压器组执行任务
我想提取特征的输出数量从每个块和把它放在某个地方（可能的某种变量或参数）然后写在日志文件的结尾在翻译过程中，每个块产生的特征的输出数量我的人格化文本。
我应该使用哪些变压器？
非常感谢你

基本统计自定义变压器

利桑德森 — 星期二，2018年5月8日格林威治标准时间17:01:54

介绍

FME的强大功能是能够从多个来源获取数据并有效地操作它。那么为什么不把FME用于数据科学呢？

我们最近在FME集线器中添加了一系列变压器，这些变压器使用RCaller或pythoncaller执行一些基本的统计测试。

如果你没有在这个列表中看到你要找的统计测试，您可以创建自己的并将其上载到FME轮毂与其他用户共享或创建新的想法如果得到足够的选票，就会把它添加到名单上。

学习

使用r或python执行shapiro-wilks统计测试

了解如何使用r或python创建自定义转换器来执行shapiro-wilks测试（测试分布的正常性）。此工作流可亚搏在线以适用于使用R或Python的任何统计测试。

变压器

列出的每个转换器都有一个指向FME中心页面的链接，以及一个测试工作区下载。由于R的外部软件需求，无法将这些测试工作区上载到集线器。每个R变压器都需要R安装在用户机器上以及sqldf r包.对于巨蟒变形金刚，这个scipy python包需要安装。

聚类分析

一聚类分析是一种确定数据组的方法。

循环计算器

使用r使用三种算法之一计算相似的数据组。此变压器仅适用于2018.0+

rclustercalculator-testworkspace.fmwt

夏皮罗-威尔克斯测验

这个夏皮罗-威尔克斯测验计算随机数据样本是否来自正态分布。

rshapirowilksCalculator（rshapirowilksCalculator）

使用r和rcaller，该变压器使用shapiro-wilks测试计算随机数据样本是否来自正态分布。

rshapirowilks-testworkspace.fmwt

皮夏皮罗威尔克斯计算器

用scipy和pythoncaller，该变压器使用夏皮罗-威尔克斯试验计算随机数据样本是否来自正态分布。

pyshapirowilks-testworkspace.fmwt

t检验

一t检验是检验两个样本的平均值是否明显不同于随机样本的统计检验。

RonesamplettestCalculator（RonesamplettestCalculator）

一个样本t检验检验了总体平均值等于规定值的无效假设，换言之，它告诉你样本的平均值是否接近某个数字，从而具有统计意义。此测试输出t值，p值，置信区间和估计。

ronesamplettest-testworkspace.fmwt

RTWOSAMPLETTESCalculator（RTWOSAMPLETTESCalculator）

两个样本t检验两组的平均值，以确定它们是否显著不同或是随机的。此测试输出t值，p值，置信区间和估计。

rtwottest-testworkspace.fmwt

使用r或python执行shapiro-wilk统计测试

利桑德森 — 清华大学，2018年4月26日格林尼治标准时间15:34:14

介绍

这个夏皮罗-威尔克测验计算随机数据样本是否来自正态分布。当p值小于或等于0.05（假设置信水平为95%）时，数据不正常。如果测试失败，您可以95%的置信度声明您的数据不符合正态分布。

本教程将详细介绍如何设置可重用的自定义转换器以使用R或Python执行统计测试。如果您使用不同的统计测试创建自己的自定义转换器，我们鼓励您将其发布到FME轮毂。

要求

如果使用R：

R安装-如何安装R指令

QLDF封装安装

如果使用python：

Scipy包装安装

下载

猪瘟病毒 （启动数据集）

rshapirowilksCalculator.fmwt（rshapirowilksCalculator.fmwt） （使用R完成夏皮罗-威尔克定制变压器）

pythonshapirowilkscalculator.fmwt（使用python完成了shapiro-wilk自定义转换器）

指令

1。添加数据

在空白工作区中读取要测试的数据集。对于这个例子，我们将使用cat.csv，它只是一个随机生成的csv文件，包含1000行，值介于-1.7824和1.1977之间。数据是正态分布的。只要测试的值是数值，就可以使用任何数据集。

将csv阅读器添加到画布并浏览cat.csv文件，默认参数正常。

2。创建自定义转换器

在画布上的任意位置单击鼠标右键，然后选择“创建自定义转换器”。将变压器命名为shapirowilkcalculator-r或shapirowilkcalculator py。如果需要，可以输入描述详细信息。

三。创建输入参数

我们将需要在整个自定义转换器中使用来自输入数据源的属性，因此让我们创建一个发布的参数来轻松完成这一任务。在“自定义转换器”选项卡中，创建新的已发布参数。然后设置以下内容：

类型	属性名称
名字	输入数据
提示	要测试的属性：
出版	是的
可选的	不
属性分配	下车

输入数据发布参数设置

第四章。创建属性

为了能够轻松地重用这个自定义转换器，我们需要创建一个属性，不管我们要评估的属性是什么，它都不会改变。添加属性管理器变压器并将其连接到自定义变压器内的输入端口。对于新属性，请将其命名为shapiro.x，然后对于属性值，将其设置为：

@real64（@value（$（input_data）））

我们将参数值括在@real64（）中，以确保我们的值是统计计算所需的浮点数据类型。

用于创建常量属性shapiro.x的attributeManager参数

如果使用R，遵循步骤5-6，如果使用python，请执行步骤7-9。

拉客

在你继续打卡勒之前，请确保您的计算机上安装了R，以及R包SqLDF见RCaller文档有关如何执行此操作的说明。

5.用R建立夏皮罗威尔克测验

现在，我们已经清理了数据并创建了一个常量属性，我们可以设置RCaller Transformer来执行shapiro-wilk测试。

添加拉客转换到画布并将其连接到AttrBuseManager。在参数中，将输入表名更改为r，然后对于列，将shapiro.x的类型更改为float。单击“确定”接受参数。更改表名后，需要将RCaller重新连接到attributeManager。

再次打开RCaller参数并粘贴以下代码：

shapiro<-shapiro.test（r$shapiro.x）fmeoutput<-data.frame（shapiro$statistic，夏皮罗（P.VALUE）

第一行是创建一个名为shapiro的对象，并在r表和shapiro.x列上执行函数shapiro.test（即shapiro-wilk测试）。此函数生成一个列表对象，所以夏皮罗成了一个名单。

第二行输出一个名为shapiro的数据帧，其中包含元素统计和p.value到fmeoutput。r使用$字符访问对象的元素。在这种情况下，它正在从列表中访问元素。

要在RCaller中设置的最后一个参数是要公开的属性。单击椭圆并添加shapiro.statistic和shapiro.p.value作为要公开的属性。这允许在RCaller之后在FME工作区中使用这些属性。

夏皮罗-威尔克试验的RCaller参数

6.完成自定义变压器

完成定制变压器，将RCaller输出端口连接到自定义变压器的输出端口。然后继续执行步骤10。

shapirowilk-r自定义转换器工作区

蟒蛇

在继续之前，请确保斯皮皮安装时使用的python版本与在fme中使用的版本相同。

第七章。保留shapiro.x

我们只需要shapiro.x属性，所以添加一个定位器转换到画布并将其连接到属性管理器。这将从模式中删除除我们感兴趣的属性之外的所有属性。在参数中选择shapiro.x作为要保留的属性。

8。使用python设置shapiro-wilk测试

现在我们已经清理了数据并创建了一个常量属性，我们可以设置蟒蛇变压器执行夏皮罗威尔克测试。

在画布上添加一个pythoncaller转换器，并将其连接到attrbutekeeper。在参数中粘贴以下代码：

导入fmeimport fmeobjects import scipy.statclass featureprocessor（object）：def u init uuuu（self）：self.x=[]def input（self，feature）：self.x.append（float（feature.getattribute（'shapiro.x'））def close（self）：results=scipy.stats.shapiro（self.x）feature=fmeobjects.fmefeature（）feature.setattribute（'shapiro.结果[0]）feature.setattribute（'shapiro.pValue'，结果[1]）self.pyoutput（feature）

前三行导入不同的包。第一次打开时，导入FME和导入FME对象已经在pythoncaller中，所以您只需要添加import scipy.stats就可以使用shapiro-wilk测试。

self.x.append（feature.getattribute（'shapiro.x'））使用属性shapiro.x作为输入属性。

结果=scipy.stats.shapiro（self.x）从scipy.stats包调用shapiro函数

最后，最后四行是创建要在FME中使用的属性。

在关闭python调用程序之前，单击要公开的属性旁边的省略号，添加shapiro.result和shapiro.pvalue，然后选择shapiro.x作为要隐藏的属性。

单击“确定”关闭蟒蛇。

夏皮罗-威尔克试验的肾盂卡勒参数

9。完成自定义变压器

完成定制变压器，将pythoncaller输出端口连接到自定义变压器的输出端口。

shapirowilk py自定义转换器工作区

R和python

10。运行翻译

切换回主选项卡，并向shapirowilk-r或shapirowilk-py变压器的输出端口添加一个检查器。打开自定义转换器的参数，并将属性设置为“测试”x，然后运行翻译。

最终结果：

R：

蟒蛇：

11.解释

如果p值小于显著性水平（在本例中为0.05，95%置信区间）可以拒绝数据正态分布的空假设。用通俗易懂的语言，如果p值小于0.05，我们可以假设数据不是正态分布的。所以对于我们的数据，p值是4.44，大于0.05，所以我们的数据是正态分布的。

其他资源

调解员：在FME中使用R的进退两难

教程：python和fme基础知识

夏皮罗威尔克测试报告文件

shapiro wilk test scipy python文档

将项目发布到FME中心

如何在具有分隔符的字段中查找值的计数？

技能72 — 周一，2018年4月9日14:54:13格林尼治标准时间

我花了几个小时重新设计我的数据，但找不到一个自动处理数据以提供统计数据的最佳解决方案。思考，我本可以用一个简单的变压器和设置逻辑的FME来省去很多麻烦。

我有一系列包含值的属性，比如“class1，第1a类，第三类，第4A类”。测量员从下拉列表中提取值，它位于用逗号（，）分隔的属性中。

EX1-TracVal.jPG

我需要计算每种物品的数量，假设它们用逗号分隔。所以，对于我上面的示例和使用相同逻辑的各种其他属性，Transformer需要返回值4。

我需要使用逻辑“如果单元格为空，值＝0，如果单元格不是空的，但不包含逗号，值=1，否则，值=（逗号数+1），即读字符串，如果字符串中有两个逗号，然后必须有三个值，依此类推。

逻辑很清楚我想实现什么，但是，我正在努力计算字符串中逗号的数目。

有人知道如何和哪些FME变压器可以应用吗？

感谢您的帮助。

根据光栅单元值计算覆盖率

戴姆麦克德莫特 — 清华大学，2018年4月5日11:05:59格林威治标准时间

大家好

我正在尝试从单波段ndvi光栅图像计算绿色/灰色百分比，即单元格值大于或小于-0.1的光栅百分比。

有人能帮忙吗？

谢谢，

戴维·麦克德莫特

开发更多的统计变压器或功能

法梅扎德 — 星期二，2018年2月20日00:20:54格林尼治标准时间

这将允许在FME中进行进一步的地理空间和一般数据分析，包括聚类分析的类型，如Jenkins自然断裂或K均值分析。目前最好的选择似乎是脚本（python，r）或其他软件（ESRI，QGIS）。

分位数/百分位数值计算

杜兰特 — 结婚，2017年11月15日15:02:22格林尼治标准时间

无论是作为一个新的变压器，还是作为一个选择在统计计算器变压器（标准，光栅，点云…列表？）