统计计算器
根据传入要素的指定属性或属性集计算统计信息。
如果功能不包含具有指定名称的属性,或者这些属性不包含有效的数字,则会将其视为对每个指定属性具有空字符串值。以“0”开头的数字将被视为八进制值。以“x”开头的数字将被视为十六进制值。
输入端口
所有功能都通过输入港口。
输出端口
将输出一个新特性,其中包含每个组的统计特性。如果特征没有分组,后者将发出一个包含整个输入特征集统计信息的单个特征。
如果未收到输入,则不会生成摘要数据。
全部输入所有特性都将通过此输出传递,并将其组的所有统计属性添加到这些输出中。注意,这将需要输入要存储到翻译结束的功能,这会大大增加内存和/或临时磁盘存储的使用量。
全部输入所有功能都将通过此输出传递,并将其组的所有统计属性添加到这些输出中。这些特征立即通过此端口,每个特征都具有从组中的第一个特征到当前特征的一组特征的统计信息。(注意,这与完成组。)
参数
变压器
如果分组依据选择属性后,统计信息将在每个特征组内独立计算。这可用于创建数据流中值的透视表式分析。
注意:并行处理如何与fme一起工作:请参见对并行处理以获取详细信息。
此参数确定转换器是否应跨并行进程执行工作。如果启用,则将为分组依据参数。
并行处理级别
参数 | 的进程数量 |
---|---|
没有并行性 | 1 |
最小的 | 核处理器(CPU)是计算机执行数学计算的物理部分。它是计算机系统中最重要的部分。传统处理器上只有一个核心,这意味着在任何给定时间,只执行一组计算。如果一个处理器是双核的,这意味着单片机包含两个处理器的硬件,现在称为核心,以区别于单片机,同时并行运行。(来源:http://www.ehow.com/facts_5730257_computer-core-processors_.html)/ 2 |
温和的 | 岩心确切数目 |
咄咄逼人的 | 核心x 1.5 |
极端的 | 核心x 2 |
例如,在四核机器上,最小并行度将导致两个同时的fme进程。8核机器上的极端并行性将导致16个同时进程。
您可以尝试使用此功能,并在windows任务管理器和工作台日志窗口中查看信息。
是的:此转换器将按顺序处理输入组。价值的变化分组依据输入流上的参数将触发当前累加组上的批处理。如果组很大/很复杂,这将提高总体速度,但如果输入组没有真正排序,则可能导致不希望的行为。
没有:这是默认行为。只有当所有输入都存在时,才会在此转换器中进行处理。
要分析的属性
将变换器连接到传入要素时,将创建属性列表。选择要计算其统计信息的所有属性。
统计计算器的传统行为是在计算单个属性的统计信息时,将包含计算统计信息的属性按指定的方式命名,如“最小值”、“最大值”、“平均值”等。在计算多个属性的统计信息时,统计计算器必须在指定的统计信息名称前加上要分析的属性的名称,以便在生成的特征上进行区分。
此选项允许用户选择是否自动确定属性命名,在这种情况下,当仅选择一个属性进行分析时,将发生传统命名,或者无论属性名称是否始终追加。也就是说,当这个选项设置为所有的结果,计算的属性将始终被命名为与所分析的属性的名称前缀(如“population._mean”),即使被分析只有一个属性。要返回到传统的行为,这种选择必须设置为只针对多个结果是的。
计算属性
每个下面的统计将在各自的属性输出,如果给出一个。留下一个计算属性名称的空白将关闭该属性的计算。
如果不是单个属性更被选定为要分析的属性要么前置输出属性名被设置为所有的结果,则计算属性的名称将与原来的属性名称前缀。(例如。如果属性“人口”和“面积”和“_mean”正在计算统计数据被输入为在其中存储计算的平均值,导致功能将包含一个名为“population._mean”和“区域新属性的属性。_mean”包含各个计算的平均值。)
- 极小值:数值最小值,除非至少有一个值是非数值的,在这种情况下,它将是词法最小值。
- 最大值:数值最大值,除非至少有一个值是非数值的,在这种情况下,这将是词法最大值。
- 中位数:如果数值数目为奇数,则按顺序列出数值时的中间值;如果数值数目为偶数,则取两个中间值的平均值。如果至少有一个非数值输入值,则按词法对列表进行排序,如果值的数量为偶数,则以两个中间值中的第一个为中值。
- 总计数:输入特性计数。
- 数字计数:输入转换器的数值的数量。特别是,空值、缺失值和空值将被忽略,并且不包括在此计数中。
- Sum:所有数值的和,如果没有数值,则为空白字符串。
- 范围:等于最大值减去最小值,如果任何值不是数字,则为空白字符串。
- 平均值:所有数值除以数值数目的总和,如果没有数值,则为空白字符串。
- 标准偏差(样本):所有数值的标准偏差,假设代表总体的一个样本(使用“无偏差”或“n-1”方法计算),如果有零个或一个数值,则为空白字符串。如果数据值很大,标准偏差计算可能会失败。在本例中,将记录一个警告,返回的标准偏差为-1。
- 标准偏差(总体):所有数值的标准偏差,包括整个总体,如果有零个或一个数值,则为空白字符串。如果数据值很大,标准偏差计算可能会失败。在本例中,将记录一个警告,返回的标准偏差为-1。
- 模式:所有值中最常见的。如果数据集是双峰的(两个或多个值以最高的频率出现),其中一个值将随机返回。
- 直方图:如果计算直方图选项被选中时,StatisticsCalculator将为分析的属性遇到的每个惟一值提供一个计数。结果以表示(值、计数)对的属性的结构化列表的形式给出。这个列表的结构有两种可能:
- 如果直方图属性列表参数给定一个值,结果列表属性将被命名
{ }.value and { }.count。例如:“_histogram {0}。值”、“_histogram {0}。数”、“_histogram {1}。值”、“_histogram {1}。数”,等等。 - 如果直方图属性列表参数为空,结果列表属性将根据计算直方图的属性命名。例如,“{0}。值”、“{0}。数”、“{1}。值”、“{1}。数”,等等。
- 如果直方图属性列表参数给定一个值,结果列表属性将被命名
例子
该StatisticsCalculator变压器可以产生的功能团体,而不是所有功能的统计信息。这有效地增加了创建FME透视表类似于Excel中的数据透视表的能力。
注意:该AttributePivoter变压器提供了一个更简单的方法来产生某种形式的数据透视表的。
源表和Excel数据透视表
在Excel中产生的虚拟数据也远销于工作台使用CSV文件。一个简单的数据透视表也是在Excel中创建的,以显示我们想要从FME生产;基本上,我们要总结基于区域和潜在的观测值。
FME透视表
下面所示的工作空间使用StatisticsCalculator变压器来创建用于通过第一组特征的观察到的特性通过区域和潜在的统计信息。然后,新的统计功能,按地区和潜力,并输出排序到CSV文件。生成的CSV文件的所有相同的属性/字段作为Excel数据透视表。
通过FME书面和观看在Excel表类似于Excel数据透视表:
您也可以使用ChartGenerator变压器以图表的数据。
编辑变压器参数
使用一组菜单选项,可以通过引用工作区中的其他元素来指定变压器参数。一些转换器中还提供了更高级的功能,如高级编辑器和算术编辑器。要访问这些选项的菜单,请单击在适用参数旁边。有关详细信息,请参见变压器参数菜单选项是的。
变压器类别
搜索FME知识中心
在上搜索有关此转换器的示例和信息FME知识中心是的。