统计信息算子
根据传入功能的指定属性或属性集计算统计信息。
如果功能不包含具有指定名称的属性,或者这些属性不包含有效数字,则它将被视为对每个指定属性的空字符串值。以'0'开头的数字将被视为八进制值。以'0x'开头的数字将被视为十六进制值。
输入端口
所有功能都进入了变压器输入港口。
输出端口
将输出单个新功能,其中包含每个组的统计属性。如果未分组功能,则后者将发出包含整组输入功能统计信息的单个功能。
如果没有收到输入,则不会产生摘要数据。
全部输入功能全部将通过此输出通过其组的所有统计属性添加到它们上。请注意,这需要所有输入要存储的功能直到翻译结束,这可以大大增加内存量和/或临时磁盘存储使用量。
全部输入功能全部将通过此输出通过所有统计属性,以显示其组的组添加到它们上。特征立即通过此端口,每个端口都具有从组中的第一个特征的集合集的统计数据到当前功能。(请注意,这与“最终”统计输出的不同之处完全的团体。)
参数
变压器
如果通过...分组选择属性,将在每组特征组中独立计算统计信息。这可用于在数据流中创建类似的值的枢轴表。
笔记:平行处理如何与FME一起使用:见关于并行处理有关详细信息。
此参数确定变压器是否应跨行进程执行工作。如果启用了,将为每个组的组启动一个过程通过...分组范围。
并行处理水平
范围 | 过程数量 |
---|---|
没有平行 | 1 |
最小 | 核心处理器或CPU是执行数学计算的计算机的物理部分。它是计算机系统中最重要的部分。传统的处理器在处理器上只有一个核心,这意味着在任何给定时间,只执行一组计算。如果处理器是双核,这意味着单个芯片包含两个处理器的硬件,现在称为核心,以将它们与单个芯片相同,并排沿同时运行。(来源:http://www.ehow.com/facts_5730257_computer-core-processors_.html)/ 2. |
缓和 | 确切数量的核心 |
挑衅的 | 核心x 1.5 |
极端 | 核心x 2 |
例如,在四核机器上,最小的并行性将导致两个同时的FME进程。8核机上的极端并行性将导致16个同时流程。
您可以尝试此功能,并在Windows任务管理器和Workbench日志窗口中查看信息。
不:这是默认行为。只有在存在所有输入时,处理将在此变换器中发生。
按组:此变压器将按顺序处理输入组。改变价值通过...分组输入流上的参数将触发当前累计组上的批处理。如果组很大/复杂,则会提高整体速度,但如果输入组未真正订购,则可能导致不期望的行为。
分析的属性
将变压器连接到传入功能时,会创建属性列表。选择您希望计算统计数据的所有属性。
统计信息管理器的传统行为,当计算单个属性的统计信息时,用于命名包含计算统计信息的属性,就像指定的那样,例如“_min”,“_max”,“_mean”等。计算统计数据时,统计信息管理器必须将分析到指定的统计名称上的属性的名称,以便可以在生成的功能上区分它们。
此选择允许人们选择是否自动确定属性命名,在这种情况下,当仅选择单个属性进行分析时将发生传统命名,或者始终附加属性名称。也就是说,当这种选择设置为时所有结果,计算的属性将始终使用prepended的分析的属性名称(例如“panters._mean”)命名,即使只分析了一个属性。要返回传统的行为,必须将此选择设置为仅限效果。
计算属性
如果给出了一个,则在相应的属性中输出以下每个统计数据。留下计算的属性名称空白将关闭该属性的计算。
如果选择了超过单个属性分析的属性或者prepend输出属性名称设定为所有结果,那么计算属性的名称将以原始属性名称为前缀。例如,如果在属性“群体”和“区域”上计算统计信息,则将“_mean”作为存储计算所计算的平均值的属性,因此产生的功能将包含名为“plation._mean”的新属性包含相应计算的平均值的“区域._mean”。
- 最小值:数值最小,除非至少一个值是非数字,在这种情况下,这将是词汇最小值。
- 最大值:数值最大值,除非至少一个值是非数字,在这种情况下,这将是词汇最大值。
- 中位数:如果值为奇数,则按顺序列出值时的中间值,或者如果偶数值为两个中间值的平均值。如果存在至少一个非数字输入值,则列表被排序,并且如果偶数值均匀,则两个中间值中的第一个作为中位数。
- 总计数:输入功能计数。
- 数字计数:输入变压器的数值数。特别是忽略空,丢失和空值,并且不包含在此计数中。
- 总和:如果没有数值,则所有数值的总和或空字符串。
- 范围:等于最大减去最小值,或者如果任何值不是数字,则为空字符串。
- 意思是:如果没有数值,则所有数值除以数字值的数量,或者空字符串。
- 标准偏差(样本):假设所有数值的标准偏差表示群体的样本(使用“非差异”或“N-1”方法),或者如果有零或者存在空白字符串一个数字值。如果数据值很大,则标准偏差计算可能会失败。在这种情况下,将记录警告,并且返回的标准偏差将为-1。
- 标准偏差(群体):所有数值的标准偏差,包括整个群体,如果有零或一个数字值,则为空字符串。如果数据值很大,则标准偏差计算可能会失败。在这种情况下,将记录警告,并且返回的标准偏差将为-1。
- 模式:最常见的所有值。如果数据集是Bimodal(两个或更多值以最高频率发生),则将随机返回其中一个值。
- 直方图:如果是计算直方图选项检查后,统计信息算程序将为分析的属性遇到的每个唯一值提供计数。结果作为存在的属性列表(价值,计数)对。此列表的结构有两种可能性:
- 如果是直方图列表属性参数给出一个值,结果列表属性将名为
{ }。值和 { }。计数。例如:“_histogram {0} .value”,“_histogram {0} .count”,“_histogram {1} .value”,“_histogram {1} .count”等。 - 如果是直方图列表属性参数留空,结果列表属性将在计算直方图的属性之后命名。例如,“区域{0} .value”,“区域{0} .count”,“区域{1} .value”,“区域{1} .count”等。
- 如果是直方图列表属性参数给出一个值,结果列表属性将名为
例子
统计信息变压器可以为特征组而不是所有功能生成统计信息。这有效地增加了在类似于Excel中类似于枢轴表的FME中创建枢轴表的能力。
笔记:这attributepivoter.变压器提供更简单的方法来生成某种形式的枢轴表。
源表和Excel枢轴表
Excel中生成的虚拟数据将其导出到CSV文件以用于Workbench。在Excel中也创建了一个简单的枢轴表,以展示我们想要从FME生产的东西;基本上我们希望基于区域和潜力来概括观察值。
FME枢轴表
下面显示的工作空间使用StatisticScalculator变压器通过区域和潜力来通过第一分组特征创建观察属性的统计信息。然后,新统计功能按区域和潜力排序,并输出到CSV文件。生成的CSV文件具有与Excel Pivot表的所有属性/字段。
由FME编写并在Excel中查看的表类似于Excel Pivot表:
你也可以使用图表变压器要将数据进行图表。
编辑变换器参数
使用一组菜单选项,可以通过引用工作区中的其他元素来分配变压器参数。一些变压器也可提供更高级的功能,例如高级编辑器和算术编辑器。要访问这些选项的菜单,请单击除适用的参数旁边。有关更多信息,请参阅变换器参数菜单选项。
变压器类别
搜索FME知识中心
搜索有关此变压器的样本和信息FME知识中心。