取样
保留的特征或者总数或特征,采样取决于采样类型选择。所述的输入特征其余的是通过输出NotSampled港口。
该变压器测试通过任意地丢弃数据,以减少数据量时,通常使用。
输出端口
保存功能都可以通过该端口输出。
未保存的功能都可以通过该端口输出。
参数
如果指定,该参数影响采样类型的行为。例如,假设采样器接收一组的15点的特征。使用通过...分组参数,采样器打破了功能分为3组。
- 组1有3个特征
- 组2具有5个特征
- 第3组有7个特征
该表显示取样数量和类型如何影响通过...分组结果:
取样量 | 采样类型 | 结果 |
---|---|---|
4 | 每N功能 |
|
4 | 首先n个特征 |
|
4 | 最后N特点 |
|
过程在结束(封闭):这是默认的行为。处理将只发生在这台变压器全部一次输入的情况下。
过程当组更改(高级):该变压器会为了处理输入组。组的值通过对输入流参数的变化会触发对当前累积组的处理。这可能会提高整体的速度(尤其是与多个,大小相等的团体),但可能导致意外的行为,如果输入组没有真正有序。
有使用两个典型原因过程当组更改(高级)。第一个是有意识地在组要被处理(并且已经如此命令)传入的数据。在这种情况下,结构决定小组通过使用 - 而不是性能方面的考虑。
第二个原因可能是潜在的性能提升。
性能提升是最有可能当数据已经排序(或使用阅读SQL ORDER BY声明),因为更少的工作需要FME的。如果数据需要排序,它可以在工作区中进行排序(虽然增加的处理开销可能会抵消任何收益)。
排序根据数据流的数目变得更困难。多个数据流可以几乎是不可能的排序到正确的顺序,因为所有的功能匹配通过...分组值需要到达之前的任何特征属于下一组(任何特征类型或数据集的)。在这种情况下,使用通过...分组同过程在结束(封闭)可能是等效的和简单的方法。
注意:多种要素类型和特点从多个数据集通常不会自然出现在正确的顺序。
如同许多情况下,在您的工作与你的数据测试不同的方法是确定性能提升的唯一准确的方法。
确定特征的数量发送到取样端口:要么总数的特征或特征的采样。
如果采样率(N)是0,则所有的输入数据将被发送到的NotSampled港口。
例如:
采样率 | 采样类型 | 结果 |
---|---|---|
1 | 每N功能 | 所有功能都进行采样。 |
2 | 每N功能 | 每第二个特点进行采样。 |
10 | 首先n个特征 | 只有第10个功能将被采样。随后的所有功能将被发送到NotSampled港口。 |
10 | 最后N特点 | 只有最后的10个功能将被采样。所有早期功能将被发送到NotSampled港口。 |
当此参数留在默认设置没有,变压器工作在它们被接收的顺序功能。
如果该参数是,它们被采样之前的输入特征混洗。所有的功能都挡在了取样,直到最后到达功能。输出端口将在他们通过这台变压器被接收到的原始顺序返回的功能。
编辑变压器参数
使用一组菜单选项,变压器参数可以通过引用在工作区中的其它元件来分配。更先进的功能,如高级编辑,算术编辑,也是一些变压器可用。要进入这些选项的菜单上,单击适用的参数旁边。欲了解更多信息,请参阅变压器参数菜单选项。
变压器分类
搜索FME社区亚搏国际在线官网
搜索样品和有关该变压器上的信息FME社亚搏国际在线官网区。