斯潘8
斯潘4
匿名数据,或删除任何使个人可识别的信息,在与公众共享数据之前,这可能是必不可少的一步。匿名对于分发最新犯罪信息但删除特定信息以保护隐私的警察部门尤其有用。
本练习将演示一种可用于匿名数据的方法,并将描述一个工作流,其中包括:亚搏在线
工作流将亚搏在线把输出写入两个不同的kml文件。第一个文件(anonymized.kml)将完全匿名,供公众使用和分发。第二个文件(original.kml)将用于内部使用,并保留所有原始属性信息,但将事故地点移动到发生事故的街道段的中点。
我们将首先构建/模拟犯罪数据集,这是基于温哥华的邮政地址信息。如果你已经在处理一个完整的犯罪数据集,步骤1-3可以省略。
模拟犯罪地点和事件类型
(1)在画布上添加一个阅读器,将esri geodatabase(文件geodb open api)指定为格式,以及“addresses.gdb”数据集。点击参数按钮,并从表列表中选择“PostalAddress”。
(2)我们将使用随机选择的地址子集来模拟温哥华犯罪事件的位置。将采样变压器连接到ESRI地理数据库读卡器。将采样率(n):设置为“10”,采样类型:到“每个第n个特征”。这将随机选择每10个钍地址,并丢弃其余的地址。
(3)既然我们已经模拟了犯罪地点,我们需要包括犯罪事件类型的信息。在画布上添加一个csv阅读器,并选择“criminal_incident.csv”文件。这个csv文件将作为我们的查找表,包含17种不同的犯罪事件类型。下一步,将随机数发生器变压器连接到采样器(采样输出端口)。并设置其:
添加一个功能合并转换器,并将其供应商输入端口连接到csv阅读器,以及随机数生成器的请求器输入端口。将FeatureMerge的参数设置为:
确保功能合并类型设置为“仅属性”。结果将是随机选择的犯罪事件类型,如csv文件中所定义,附加到我们模拟的犯罪地点。
修改属性信息
(4)我们将删除应保密的信息,以及其他不必要的属性信息,通过使用attributeManager Transformer从我们的数据集中获取。将attributeManager Transformer连接到FeatureMerge(合并输出端口)。删除属性,仅保留:
此外,创建2个新属性:
删除“黑名单”字
(5)下一步是修改“黑名单”信息。例如,我们将替换所有攻击类型(例如严重攻击,简单攻击,性攻击)用“攻击”来掩饰黑名单上的话。将StringReplacer变压器连接到属性管理器。打开它的参数,和设置;
严重侵犯简单侵犯性侵犯
将犯罪事件地点匿名到100个街区地址
(6)匿名地址的第一步是从pstladress属性中提取家庭地址,并使用StringSearcher转换器将其写入新属性(“第一个匹配”)。将StringSearcher连接到StringReplacer。设置StringSearcher参数;
([^\s]+)
(7)匿名地址中的大部分工作使用带有条件语句的attributeManager转换器。条件语句用于第一次测试地址的长度,然后用0替换尾随的数字,然后将该值写入名为“address_anon”的属性。
将attributeManager连接到StringSearcher(匹配的输出端口)。打开它的参数,并添加一个名为“address_anon”的新输出属性。对于属性值,单击箭头并使用“条件值…”编辑器。完成以下条件陈述:
左值 |
操作员 | 正确值 |
@字符串长度(@value(_first_match))。 |
= | 四 |
输出值: |
||
@左(@value(\u first\u match),2)00 |
左值 |
操作员 | 正确值 |
@字符串长度(@value(_first_match))。 |
= | 三 |
输出值: |
||
@左(@value(\u first\u match),1)00 |
左值 |
操作员 | 正确值 |
@字符串长度(@value(_first_match))。 |
= | 二 |
输出值: |
||
零 |
左值 | 操作员 | 正确值 |
@字符串长度(@value(_first_match))。 |
= | 一 |
输出值: |
||
零 |
完成后,最终条件声明屏幕应如下所示:
(8)接下来,我们将使用一个StringReplacer变压器更新原始地址位置,其中包含块级别的通用信息。将StringReplacer连接到属性管理器。打开StringReplacer参数,设置:
这将用100个块级地址覆盖原始地址值。
将事故地点绘制到街道段的中点
我们现在可以使用更新后的地址信息将事故地点参考到路段,把犯罪地点移到街道的中间。
(9)将AutoCAD DWG/DXF读卡器添加到画布中,并选择道路数据集。打开它的参数,并通过“属性架构”设置组实体。在添加读卡器之前,请确保将工作流选项设置为“单个合并的功能类型”。亚搏在线名为的新道路特征类型
地址匹配中的特殊情况-街道范围
温哥华的一些道路没有一个100个街区的地址,但应使用共享同一路段的一系列地址(例如“1300-1400 laburnum st”)。在我们将犯罪事件与街道划分相匹配之前,我们必须为每100个街区创建路段(例如“1300 laburnum st”,和“1400 Laburnum St”。我们将利用StringSearcher和StringReplacer变压器修改路段上的地址信息,以匹配地址。
(10)将StringSearcher转换器连接到AutoCAD Reader。打开其参数并设置:
-
(11)添加2个StringReplacers,并将它们连接到StringSearcher的匹配输出端口。
第一个StringReplacer转换器将用于将第一个地址保持在范围内,丢弃第二个地址,并将此信息附加到路段。设置第一个StringReplacer变压器的参数:
(\-)([^\s]+)
第二个StringReplacer将用于将第二个地址保持在范围内,丢弃第一个地址,并将此信息附加到路段。设置第二个StringReplacer变压器的参数:
([^\s]+)(\-)
创建块中点
(12)增加功能合并变压器,并将其请求器输入端口连接到步骤8中的StringReplacer Transformer输出端口。将FeatureMerge的供应商端口连接到步骤11中的StringReplacer变压器,以及步骤10中的StringSearcher不匹配的输出端口。合并关系的特点如下:
打开FeatureMerge Transformer参数并将join设置为on,到:
(13)在画布中添加一个CenterpointReplacer变压器,并将其连接到FeatureMerge合并输出端口。打开它的参数,并设置其模式=中心点。这将为发生犯罪事件的每个路段创建一个新的中心点。
写入输出
我们最后的步骤将涉及到对工作区进行分支,以便为包含匿名数据的公共用途创建一个kml文件,并创建一个包含所有原始属性信息的内部使用文件。我们还将通过使用kmlstyler转换器来修改最终输出文件的外观。
(14)公用和分配
在画布中添加一个kmlstyler转换器,并将其连接到Centerpointreplacer。更改图标,(即名称:gme/gx_placemark_circle_highlight)并将标签样式比例设置为0。
添加Google KML格式编写器。在添加到画布之前,设置特征类型定义=手动,并将特征类型命名为“匿名”。将其连接到kmlstyler。打开编写器参数,并从“用户属性”选项卡添加以下属性:
(15)内部使用
在画布中添加一个kmlstyler转换器,并将其连接到Centerpointreplacer。更改图标,(即名称:gme/gx_placemark_circle)并将标签样式比例设置为0。
添加Google KML格式编写器。在添加到画布之前,设置特征类型定义=手动,并将特征类型名称设为“原始”。把它连接到kmlstyler,打开编写器的参数,并从“用户属性”选项卡添加以下属性:
(16)运行工作区,检查两个生成的kml文件。
使用attributecompressor transformer共享加密数据(可选)
FME使您可以在通过使用attributecompressor转换器共享数据之前对数据进行加密。通过选择要加密的属性,提供密码,选择加密类型aes-256,可以对输出文件中的指定信息应用加密。一旦加密,可以使用attributedCompressor变压器和原始密码解密信息。
?2019安全亚搏在线软件公司|合法的