统计计算器
根据传入功能的指定属性或一组属性计算统计信息。
如果功能不包含具有指定名称的属性,或者这些属性不包含有效的数字,然后,它将被视为具有每个指定属性的空字符串值。以“0”开头的数字将被视为八进制值。以“0x”开头的数字将被视为十六进制值。
输入端口
所有功能通过输入端口。
输出端口
将输出一个新功能,其中包含每个组的统计信息属性。如果功能未分组,后者将发出一个包含整个输入特征集统计信息的单一特征。
如果没有收到输入,则不会生成摘要数据。
所有输入所有特性都将通过此输出传递,并将其组的所有统计属性添加到这些特性中。请注意,这将需要输入要存储到翻译结束的功能,这会大大增加内存和/或临时磁盘存储的使用量。
所有输入所有特性都将通过此输出传递,并将其组的所有统计信息属性添加到这些特性中。功能立即通过此端口,每个都有从组中的第一个特征到当前特征的一组特征的统计信息。(请注意,这与完成组)
参数
变压器
如果小组通过选择属性,统计数据将在每组特征中独立计算。这可用于创建数据流中类似透视表的值分析。
注:并行处理如何与FME一起工作:请参见关于并行处理有关详细信息。
此参数确定Transformer是否应跨并行进程执行工作。如果启用了,将为指定的每个组启动一个进程分组参数。
并行处理级别
参数 | 进程数 |
---|---|
无平行性 | 一 |
极小值 | 岩心处理器,或CPU,是执行数学计算的计算机的物理部分。它是计算机系统中最重要的部分。传统的处理器只有一个核心,意思是在任何给定的时间,仅执行一组计算。如果处理器是双核的,这意味着单芯片包含两个处理器的硬件,现在称之为核心,以区别于单芯片,同时运行,并排。(资料来源:http://www.ehow.com/facts_5730257_computer-core-processors_u.html)2 |
适度的 | 核心的确切数量 |
侵略性 | 核心X 1.5 |
极端 | 核心X 2 |
例如,在四核机器上,最小并行性将导致两个同时进行的FME过程。8核机器上的极端并行性将导致16个同步进程。
您可以尝试使用此功能,并在Windows任务管理器和工作台日志窗口中查看信息。
是的:此变压器将按顺序处理输入组。更改的值小组通过输入流上的参数将触发对当前累积组的批处理。如果群体较大/复杂,这将提高整体速度,但如果输入组没有真正排序,则可能会导致不需要的行为。
不:这是默认行为。只有当所有输入都存在时,处理才会在此变压器中进行。
要分析的属性
当您将转换器连接到传入功能时,将创建属性列表。选择要计算其统计信息的所有属性。
统计计算器的传统行为,计算单个属性的统计信息时,是按照指定的方式命名包含计算统计信息的属性,比如“阿敏”,“最大”“平均”等等。当计算多个属性的统计信息时,StatisticsCalculator必须将要分析的属性的名称前置到指定的统计名称上,以便在结果特征上对它们进行区分。
此选项允许选择是否自动确定属性命名,在这种情况下,当只选择一个属性进行分析时,就会进行传统的命名。或者,如果属性名总是附加在后面,则不管。也就是说,当此选项设置为对于所有的结果,计算出的属性将始终以所分析属性的名称(如“population.\u mean”)命名,即使只分析一个属性,为了回到传统的行为,此选项必须设置为仅用于多个结果.
计算属性
以下每个统计信息将在各自的属性中输出,如果给了一个。将计算属性名称留空将关闭该属性的计算。
如果为选择了多个属性要分析的属性或前置输出属性名称设置为对于所有的结果,然后计算属性的名称将以原始属性名称作为前缀。(例如)如果正在计算属性“population”和“area”的统计信息,输入“mean”作为存储计算平均值的属性,生成的功能将包含名为“population.\u mean”和“area.\u mean”的新属性,以包含各自的计算平均值。)
- 最小值:数值最小值,除非至少有一个值不是数字,在这种情况下,这将是词汇的最小值。
- 最大值:数值最大值,除非至少有一个值不是数字,在这种情况下,这将是词汇的最大值。
- 中值:如果值的数目是奇数,则按顺序列出值时的中间值。或两个中间值的平均值(如果值的数目为偶数)。如果至少有一个非数字输入值,然后对列表进行词汇排序,如果两个中间值的数目相等,则取中间值中的第一个作为中间值。
- 总计数:输入功能计数。
- 数值计数:输入变压器的数值数量。特别地,空的,失踪,忽略空值,不包括在这个计数中。
- sum:所有数值的总和,如果没有数值,则为空字符串。
- 范围:等于最大值减去最小值,如果任何值不是数字,则为空字符串。
- 平均值:所有数值之和除以数值之和,如果没有数值,则为空字符串。
- 标准差(样本):所有数值的标准差,假设代表一个总体样本(使用“无偏差”或“n-1”方法计算);如果有零个或一个数值,则为空字符串。如果数据值很大,标准偏差计算可能会失败。在这种情况下,将记录一个警告,返回的标准偏差为-1。
- 标准差(总体):所有数值的标准差,包括整个人口,如果有零个或一个数值,则为空字符串。如果数据值很大,标准偏差计算可能会失败。在这种情况下,将记录一个警告,返回的标准偏差为-1。
- 模式:所有值中最常见的。如果数据集是双峰的(两个或多个值以最高频率出现),其中一个值将随机返回。
- 柱状图:如果计算柱状图选项被选中,StatisticsCalculator将为所分析属性遇到的每个唯一值提供一个计数。结果以一个结构化的属性列表的形式给出,这些属性显示(值、计数)对。此列表的结构有两种可能:
- 如果柱状图列表属性给参数一个值,结果列表属性将被命名为
{ }值和 { }。伯爵。例如:“直方图0.value”,“0.计数直方图”,“1.值”,“1.计数”,等。 - 如果柱状图列表属性参数为空,结果列表属性将以计算柱状图的属性命名。例如,“区域0.value”,“区域0.count”,“区域1.value”,“区域1.count”,等。
- 如果柱状图列表属性给参数一个值,结果列表属性将被命名为
例子
统计量计算器转换器可以为特征组而不是所有特征生成统计信息。这有效地增加了在FME中创建透视表的能力,类似于Excel中的透视表。
注:这个属性投票人Transformer提供了一种生成某些形式的透视表的简单方法。
源表和Excel透视表
在Excel中生成的虚拟数据被导出到一个csv文件中,以便在工作台中使用。在Excel中还创建了一个简单的透视表,以显示我们想要从FME中生成什么;基本上,我们要根据区域和势来总结观测值。
FME枢轴表
下面显示的工作区使用StatisticsCalculator Transformer通过按区域和潜力对特征进行第一次分组,为观察到的属性创建统计信息。然后根据地区和潜力对新的统计特征进行排序,并输出到csv文件。生成的csv文件具有与excel透视表相同的所有属性/字段。
由FME编写并在Excel中查看的表类似于Excel数据透视表:
您也可以使用字符发生器转换以绘制数据图表。
编辑变压器参数
使用一组菜单选项,可以通过引用工作区中的其他元素来指定变压器参数。更高级的功能,例如高级编辑器和算术编辑器,也可用于一些变压器。要访问这些选项的菜单,点击在适用参数旁边。更多信息,看见变压器参数菜单选项.
变压器类别
搜索FME知识中心
在上搜索有关此变压器的示例和信息FME知识中心.