你好,我想根据图号总结每种路线类型的长度。例如,在地图第000号,它将给出程序1的总长度,项目2和岛屿和转弯车道。我的读者是一个在线专题班,我还有单独的映射索引类。理想的,我想为相关的地图编号提供有关每种路线类型的距离的属性。我试过取样器,statisticscalculator(静态计数器)聚合器等等,他们没有给出我想要的结果。也许有什么背景或其他变形金刚我可以尝试?谢谢您。
添加在翻译成功或失败后在FME服务器Web界面上添加自定义翻译消息的功能。在FME桌面上,我使用启动/关闭脚本来解析日志文件,并收集弹出窗口显示用户信息的统计信息。如果能够在最终用户运行工作区后直接将此信息添加到页面中,那就太好了。
我正在构建一个流程,该流程需要几何图形功能中(外部)部分的总量。我需要从一个(因此是1)或多个(2+)特征中得到的部分总数,以便进行进一步的统计分析。为了得到这个,我使用了partcounter,它会给我返回几何体中零件数的partcounter。对于多组和集料,这是零件的数量,至于路径,这是段数。否则,就是一个。
我希望,在单个功能(甜甜圈)上使用此功能时。它将返回值1,但在附加的示例中,还有我试过的其他甜甜圈,它返回甜甜圈的总量+外部零件的总量。
是否可以在不使用内部边界的情况下使用另一个变压器来获取部件计数,而不需要使用Donuholefilter来填充Donutsholes?或者只是计算一下外部边界部分?
填充甜甜圈非常耗时且占用CPU(例如,对于10000个对象,但也可以处理带有x百万的集合,这将需要几个小时的额外时间):
28.6秒。(CPU:27.3s用户,1.0s系统)对1分51.8秒。(CPU:63.4s用户,22.6S系统
简而言之,问题是:
获取值51,但希望值1(1个对象,不是内外边界)。非En2NO.FMWT
工作区统计信息有助于您了解以及你组织中的其他人,正在使用FME。这将允许您:
附件是一个工作区,它将读取一个或多个工作区,并生成包含各种工作区统计信息的Excel电子表格,包括:
输出为Excel电子表格,包含以下表格:
文件复制工作区:文件复制工作区.fmw(运行于2018.0或更高版本)
统计工作区:工作区统计.fmw(运行于2018.0或更高版本)
示例结果:WorkspaceStatistics_webinars.zip(工作区统计)
如果对工作区进行了任何更改,或者发现问题,请在这里分享您的变化和想法,以便每个人都能受益。
请与我们分享您的结果fmestats@亚搏在线safe.com公司-这将帮助我们确定哪些格式和变压器对FME用户更重要。请区分桌面分析和FME服务器存储库分析。
如果您有敏感项目(推荐),统计工作区允许您混淆工作区名称(可选)。您也可以选择忽略自定义变压器(如果这些变压器是敏感的)。我们将合并来自所有用户的结果并在此处发布它们。
运行统计工作区(工作区统计.fmw):指向包含工作区的目录(或指向包含工作区的一组目录的根目录)。然后,统计信息工作区将获得它找到的所有工作区和/或自定义转换器的统计信息。
指向一个目录更有效,而不是扫描系统上的所有目录(这可能非常慢)。为了帮助解决这个问题,我们还提供了另一个工作区(文件复制工作区.fmw)这将通过将一组文件夹中的所有.fmw/.fmx文件复制到一个目录中来创建工作区目录。如果读取无效或损坏的工作区,工作区读卡器(FMW)可能会失败-这就是为什么最好将所有工作区复制到一个文件夹中,然后删除或调查问题工作区。
分两步运行filecopyworkspace.fmw。
启用路径读取器并使用文件浏览器指向“根”目录。文件和目录路径读取器将扫描此根文件夹下的所有目录,并创建FME工作区的目录。编辑目录以删除任何重复的工作区,等。
禁用路径读取器并启用Excel读取器。工作区将读取工作区目录,并将所有工作区复制到一个公用文件夹中。
输入提示:
使用统计有什么不同?
安装FME时,您可以选择向我们发送使用统计信息。这给了我们一张你要添加到你的工作区的格式和变形金刚的图片。但有些工作空间很少被编辑,它们只是运行——尤其是那些您可能在生产服务器上拥有的工作区。我们认为这些工作区可能是您拥有的最重要的工作区,我们无法获取它们的统计数据。
变压器连接
上有更多变压器连接可用变压器廊道.
我们已经运行了工作区统计数据,例如在安全的网络研讨会中使用的工作区,以说明所附的结果。亚搏在线
文件复制工作区:文件复制工作区.fmw(运行于2018.0或更高版本)
统计工作区:工作区统计.fmw(运行于2018.0或更高版本)
示例结果:WorkspaceStatistics_webinars.zip(工作区统计)
如果对工作区进行了任何更改,或者发现问题,请在这里分享您的变化和想法,以便每个人都能受益。
你好,
我想读取一些特定字段的所有属性,然后计算一些讽刺。
我知道使用多个统计计算器和功能合并是可能的。
如何在Python调用程序内执行此操作?
谢谢
我只想配置一个小的日志文件,声明来自我工作区的几个连接(管道)的相同计数。让我们调用检查点。
是否有比在每个检查点添加计数器/分拣机/取样器或统计计算器更好的方法?
统计计算器有点过分杀伤力,我想。
如果没有,我的伤口就像一个新的微型变压器,只不过是为了保护计数不受管道的影响,所以我可以命名每个检查点并将它们收集到一个文件中。
必须有一种方法可以重复使用每根管道的数量,以一种简单的方式,正确的?
由于数据存储和传输成本是除FME云实例成本之外的费用,随着时间的推移,跟踪使用情况会很方便。当前的计费仪表板提供了月份到日期的指标,但如果能够看到每天的传输和存储使用情况(以KB/MB/GB为单位,而不是-或除此之外-美元)。这些信息可以显示在图形或表格中。
有关详细信息,请参阅此问题:
https://knowledge.亚搏在线safe.com/questions/75739/fme-cloud-data-transfer-statistics-reporting.html网站
你好,
我在一个工作区工作,那里有多个变压器组执行任务
我想提取特征的输出数量从每个块和把它放在某个地方(可能的某种变量或参数)然后写在日志文件的结尾在翻译过程中,每个块产生的特征的输出数量我的人格化文本。
我应该使用哪些变压器?
非常感谢你
FME的强大功能是能够从多个来源获取数据并有效地操作它。那么为什么不把FME用于数据科学呢?
我们最近在FME集线器中添加了一系列变压器,这些变压器使用RCaller或pythoncaller执行一些基本的统计测试。
如果你没有在这个列表中看到你要找的统计测试,您可以创建自己的并将其上载到FME轮毂与其他用户共享或创建新的想法如果得到足够的选票,就会把它添加到名单上。
了解如何使用r或python创建自定义转换器来执行shapiro-wilks测试(测试分布的正常性)。此工作流可亚搏在线以适用于使用R或Python的任何统计测试。
列出的每个转换器都有一个指向FME中心页面的链接,以及一个测试工作区下载。由于R的外部软件需求,无法将这些测试工作区上载到集线器。每个R变压器都需要R安装在用户机器上以及sqldf r包.对于巨蟒变形金刚,这个scipy python包需要安装。
一相关性是两个变量之间的一个测试,用于确定它们之间的关联。
使用r计算两个变量之间是否存在关联。
rcorrelation-testworkspace.fmwt
一聚类分析是一种确定数据组的方法。
使用r使用三种算法之一计算相似的数据组。此变压器仅适用于2018.0+
rclustercalculator-testworkspace.fmwt
这个夏皮罗-威尔克斯测验计算随机数据样本是否来自正态分布。
使用r和rcaller,该变压器使用shapiro-wilks测试计算随机数据样本是否来自正态分布。
rshapirowilks-testworkspace.fmwt
用scipy和pythoncaller,该变压器使用夏皮罗-威尔克斯试验计算随机数据样本是否来自正态分布。
pyshapirowilks-testworkspace.fmwt
一t检验是检验两个样本的平均值是否明显不同于随机样本的统计检验。
一个样本t检验检验了总体平均值等于规定值的无效假设,换言之,它告诉你样本的平均值是否接近某个数字,从而具有统计意义。此测试输出t值,p值,置信区间和估计。
ronesamplettest-testworkspace.fmwt
两个样本t检验两组的平均值,以确定它们是否显著不同或是随机的。此测试输出t值,p值,置信区间和估计。
这个夏皮罗-威尔克测验计算随机数据样本是否来自正态分布。当p值小于或等于0.05(假设置信水平为95%)时,数据不正常。如果测试失败,您可以95%的置信度声明您的数据不符合正态分布。
本教程将详细介绍如何设置可重用的自定义转换器以使用R或Python执行统计测试。如果您使用不同的统计测试创建自己的自定义转换器,我们鼓励您将其发布到FME轮毂。
如果使用R:
R安装-如何安装R指令
QLDF封装安装
如果使用python:
Scipy包装安装
猪瘟病毒 (启动数据集)
rshapirowilksCalculator.fmwt(rshapirowilksCalculator.fmwt) (使用R完成夏皮罗-威尔克定制变压器)
pythonshapirowilkscalculator.fmwt(使用python完成了shapiro-wilk自定义转换器)
1。添加数据
在空白工作区中读取要测试的数据集。对于这个例子,我们将使用cat.csv,它只是一个随机生成的csv文件,包含1000行,值介于-1.7824和1.1977之间。数据是正态分布的。只要测试的值是数值,就可以使用任何数据集。
将csv阅读器添加到画布并浏览cat.csv文件,默认参数正常。
2。创建自定义转换器
在画布上的任意位置单击鼠标右键,然后选择“创建自定义转换器”。将变压器命名为shapirowilkcalculator-r或shapirowilkcalculator py。如果需要,可以输入描述详细信息。
三。创建输入参数
我们将需要在整个自定义转换器中使用来自输入数据源的属性,因此让我们创建一个发布的参数来轻松完成这一任务。在“自定义转换器”选项卡中,创建新的已发布参数。然后设置以下内容:
类型 | 属性名称 |
名字 | 输入数据 |
提示 | 要测试的属性: |
出版 | 是的 |
可选的 | 不 |
属性分配 | 下车 |
输入数据发布参数设置
第四章。创建属性
为了能够轻松地重用这个自定义转换器,我们需要创建一个属性,不管我们要评估的属性是什么,它都不会改变。添加属性管理器变压器并将其连接到自定义变压器内的输入端口。对于新属性,请将其命名为shapiro.x,然后对于属性值,将其设置为:
@real64(@value($(input_data)))
我们将参数值括在@real64()中,以确保我们的值是统计计算所需的浮点数据类型。
用于创建常量属性shapiro.x的attributeManager参数
在你继续打卡勒之前,请确保您的计算机上安装了R,以及R包SqLDF见RCaller文档有关如何执行此操作的说明。
5.用R建立夏皮罗威尔克测验
现在,我们已经清理了数据并创建了一个常量属性,我们可以设置RCaller Transformer来执行shapiro-wilk测试。
添加拉客转换到画布并将其连接到AttrBuseManager。在参数中,将输入表名更改为r,然后对于列,将shapiro.x的类型更改为float。单击“确定”接受参数。更改表名后,需要将RCaller重新连接到attributeManager。
再次打开RCaller参数并粘贴以下代码:
shapiro<-shapiro.test(r$shapiro.x)fmeoutput<-data.frame(shapiro$statistic,夏皮罗(P.VALUE)
第一行是创建一个名为shapiro的对象,并在r表和shapiro.x列上执行函数shapiro.test(即shapiro-wilk测试)。此函数生成一个列表对象,所以夏皮罗成了一个名单。
第二行输出一个名为shapiro的数据帧,其中包含元素统计和p.value到fmeoutput。r使用$字符访问对象的元素。在这种情况下,它正在从列表中访问元素。
要在RCaller中设置的最后一个参数是要公开的属性。单击椭圆并添加shapiro.statistic和shapiro.p.value作为要公开的属性。这允许在RCaller之后在FME工作区中使用这些属性。
夏皮罗-威尔克试验的RCaller参数
6.完成自定义变压器
完成定制变压器,将RCaller输出端口连接到自定义变压器的输出端口。然后继续执行步骤10。
shapirowilk-r自定义转换器工作区
在继续之前,请确保斯皮皮安装时使用的python版本与在fme中使用的版本相同。
第七章。保留shapiro.x
我们只需要shapiro.x属性,所以添加一个定位器转换到画布并将其连接到属性管理器。这将从模式中删除除我们感兴趣的属性之外的所有属性。在参数中选择shapiro.x作为要保留的属性。
8。使用python设置shapiro-wilk测试
现在我们已经清理了数据并创建了一个常量属性,我们可以设置蟒蛇变压器执行夏皮罗威尔克测试。
在画布上添加一个pythoncaller转换器,并将其连接到attrbutekeeper。在参数中粘贴以下代码:
导入fmeimport fmeobjects import scipy.statclass featureprocessor(object):def u init uuuu(self):self.x=[]def input(self,feature):self.x.append(float(feature.getattribute('shapiro.x'))def close(self):results=scipy.stats.shapiro(self.x)feature=fmeobjects.fmefeature()feature.setattribute('shapiro.结果[0])feature.setattribute('shapiro.pValue',结果[1])self.pyoutput(feature)
前三行导入不同的包。第一次打开时,导入FME和导入FME对象已经在pythoncaller中,所以您只需要添加import scipy.stats就可以使用shapiro-wilk测试。
self.x.append(feature.getattribute('shapiro.x'))使用属性shapiro.x作为输入属性。
结果=scipy.stats.shapiro(self.x)从scipy.stats包调用shapiro函数
最后,最后四行是创建要在FME中使用的属性。
在关闭python调用程序之前,单击要公开的属性旁边的省略号,添加shapiro.result和shapiro.pvalue,然后选择shapiro.x作为要隐藏的属性。
单击“确定”关闭蟒蛇。
夏皮罗-威尔克试验的肾盂卡勒参数
9。完成自定义变压器
完成定制变压器,将pythoncaller输出端口连接到自定义变压器的输出端口。
shapirowilk py自定义转换器工作区
10。运行翻译
切换回主选项卡,并向shapirowilk-r或shapirowilk-py变压器的输出端口添加一个检查器。打开自定义转换器的参数,并将属性设置为“测试”x,然后运行翻译。
最终结果:
R:
蟒蛇:
11.解释
如果p值小于显著性水平(在本例中为0.05,95%置信区间)可以拒绝数据正态分布的空假设。用通俗易懂的语言,如果p值小于0.05,我们可以假设数据不是正态分布的。所以对于我们的数据,p值是4.44,大于0.05,所以我们的数据是正态分布的。
我花了几个小时重新设计我的数据,但找不到一个自动处理数据以提供统计数据的最佳解决方案。思考,我本可以用一个简单的变压器和设置逻辑的FME来省去很多麻烦。
我有一系列包含值的属性,比如“class1,第1a类,第三类,第4A类”。测量员从下拉列表中提取值,它位于用逗号(,)分隔的属性中。
我需要计算每种物品的数量,假设它们用逗号分隔。所以,对于我上面的示例和使用相同逻辑的各种其他属性,Transformer需要返回值4。
我需要使用逻辑“如果单元格为空,值=0,如果单元格不是空的,但不包含逗号,值=1,否则,值=(逗号数+1),即读字符串,如果字符串中有两个逗号,然后必须有三个值,依此类推。
逻辑很清楚我想实现什么,但是,我正在努力计算字符串中逗号的数目。
有人知道如何和哪些FME变压器可以应用吗?
感谢您的帮助。
大家好
我正在尝试从单波段ndvi光栅图像计算绿色/灰色百分比,即单元格值大于或小于-0.1的光栅百分比。
有人能帮忙吗?
谢谢,
戴维·麦克德莫特
这将允许在FME中进行进一步的地理空间和一般数据分析,包括聚类分析的类型,如Jenkins自然断裂或K均值分析。目前最好的选择似乎是脚本(python,r)或其他软件(ESRI,QGIS)。
无论是作为一个新的变压器,还是作为一个选择在统计计算器变压器(标准,光栅,点云…列表?)