西班牙
斯潘4
重复特征(空间术语)是指其几何图形与工作流中其他特征的几何图形完全匹配的特征。亚搏在线当同一个功能意外地被提交到数据库两次,或者两个(或更多)重叠的数据集合并在一起时,可能会发生这种情况。
许多fme变压器可以识别重复的特征,但是一些变压器或变压器的组合将比其他变压器更有效。
一般来说,crccalculator效率更高(因为比较只在两个不同的数字字符串之间进行,而不是在完整的几何体之间),特别是当crc值与数据一起存储时,因此不需要每次都重新创建。
然而,匹配器对于更复杂的几何体(例如具有纹理的几何体)、比较坐标系以及以不同的方式匹配空属性或缺少的属性更好。
在这两个例子中,我们将首先使用匹配器变压器识别重复特征,然后将crccalculator与匹配器结合使用。
源数据是包含温哥华市公园的Mapinfo选项卡文件:
按映射平铺 雄蕊设计,在 CC-BY-3.0型是的。数据依据 开放式街道地图,在 CC-BSA是的。
假设有重复的park功能(使用相同的,而不是不同的id号),我们需要查找、计数和删除重复的功能。
按照以下步骤学习如何使用匹配转换器定位重复的功能。
1.启动fme workbench并从一个空画布开始。从菜单栏中选择读卡器>添加读卡器。
将数据格式设置为mapinfo tab(mitab)。选择附加的Mapinfo数据集作为源,然后单击“确定”添加读取器。
2.添加匹配器转换器并将其连接到读卡器功能类型。在匹配器变压器参数中,设置:
也可选择设置:
三。将检测变压器连接到每个匹配器输出端口:
运行工作区。
没有匹配的特征将退出NoTrimePoT。
退出单端口的特征是重复记录的单个实例。退出匹配端口的所有特性都是重复记录的实例。
如果设置了属性匹配参数,则复制将同时是id和几何体,否则将仅是匹配几何体。
四。将统计计算器转换器添加到匹配器的匹配输出端口。设置参数为:
要简单地获得大量重复的特性,请将摘要输出端口连接到检查器。要保留所有重复的功能供检查,请连接完整的输出端口。
5.运行工作区。检查不同的输出,确保查找numberofdupl属性。此属性表示数据集中存在多少重复的特性。
6.对于重复的特性,通常的修复方法是简单地丢弃重复的特性,保留它们的一个副本。对于匹配器转换器,这意味着保持NotMatched和SingleMatched输出。
因此,可以选择以您选择的格式向工作区添加一个写入器。将NotMatched和SingleMatched输出连接到writer特性类型,而将match端口不连接,或只连接到Inspector或Logger transformer:
按照以下步骤学习如何使用匹配转换器定位重复的功能。
1.启动fme workbench并从一个空画布开始。从菜单栏中选择读卡器>添加读卡器。
将数据格式设置为mapinfo tab(mitab)。选择附加的Mapinfo数据集作为源,然后单击“确定”添加读取器。
2.添加CRCCalculator转换器并将其连接到reader特性类型。在CRCCalculator变压器参数中,设:
可选地添加一个检查器转换器并运行工作区。检查每个特征的计算crc值。
三。添加一个匹配变压器,连接到CRCCalculator输出端口:
在匹配器变压器参数中,设置:
将检查变压器连接到每个匹配器输出端口并运行工作区。
与前面一样,没有匹配的特性将从NotMatched端口退出。
退出单端口的特征是重复记录的单个实例。退出匹配端口的所有特性都是重复记录的实例。
四。将统计计算器转换器添加到匹配器的匹配输出端口。设置参数为:
要简单地获得大量重复的特性,请将摘要输出端口连接到检查器。要保留所有重复的功能供检查,请连接完整的输出端口。
5.运行工作区。检查不同的输出,确保查找numberofdupl属性。此属性表示数据集中存在多少重复的特性。
6.对于重复的特性,通常的修复方法是简单地丢弃重复的特性,保留它们的一个副本。对于匹配器转换器,这意味着保持NotMatched和SingleMatched输出。
因此,可以选择以您选择的格式向工作区添加一个写入器。将NotMatched和SingleMatched输出连接到writer特性类型,而将match端口不连接,或只连接到Inspector或Logger transformer:
这里使用的数据来源于不列颠哥伦比亚省温哥华市(data.vancover.ca.温哥华)。它包含在开放政府许可下的信息-温哥华。
?2019安全亚搏在线软件公司|合法的