15000 gml合并

Question

大家好，

我有15000多个GML文件，总计43GB，包含OS MasterMap的网格，我想将它们缝合到一个ESRI地理数据库中。

我尝试将一个合并的功能类型读取器合并为一个写入器，但它变得非常缓慢，只写了一小部分文件。有人有什么建议或者知道尝试这个的限制吗？

提前谢谢！

杰克

Answer 1 · 2019-07-26T17:21:19Z

回答通过马克2ATSA亚搏在线FE ·7月26日下午5:21

我试着按照《红地学》的建议把它分解。

创建工作区1。读取单个gml文件并写入文件geodatabase
创建工作区2。
- 添加目录和文件路径名类型的读取器
  - 设置读取器以读取GML文件的列表
- 添加WorkspaceRunner变压器
  - 将workspacerunner workspace参数设置为run workspace 1。
  - 它应该显示一个reader数据集参数。设置为路径窗口的值

现在运行工作区2。它将读取第一个gml文件的名称并将其发送到工作区1进行处理。它将被处理并添加到geodatabase中。然后工作区2将发送第二个数据集、第三个、第四个等的名称。

此外，WorkspaceRunner允许您同时运行多达7个进程。当写入相同的输出时，我会犹豫是否建议这样做，但是geodatabase应该是可以的（即如果一个进程在写入geodatabase时锁定了它，其他进程应该等待锁被释放，然后再写入）。

无论如何，使用一个目录，比如说，20个gml文件，尝试上面的方法。一旦你知道这是可行的，你就可以估计总共15000人需要多长时间。随着时间的推移，速度可能会减慢，但我想不会太快。

顺便问一下，您使用的是哪个fme版本和哪个geodatabase writer（arcobjects或api）？

添加注释· 表演2· 分享

10 4000需要的字符剩余字符超过个字符

附件：最多可使用10个附件（包括图像），每个最大值为4 MB，总计为4 MB。

杰克朗斯代尔 ·7月29日上午7:16 0个

嗨，马克，

非常感谢你的建议，我会试试的！我正在使用fme 2109.0，我相信openapi编写器。

达拉特保险箱亚搏在线杰克朗斯代尔 ·8月9日凌晨4:58 0个

我想 @埃戈姆下面的注释很重要——如果文件确实是“毛茸茸的平铺”，因为与平铺相交的功能可能在其他平铺中，则需要一些重复的删除策略，以避免这些功能多次出现在最终数据集中。

使用mark的计划（我认为这是一个成功的计划），您需要a）修改“worker”工作区（工作区1）以检查每个功能是否还没有写出。怎么用？好吧，我建议您作为第二个作者在工作台中创建一个sqlite数据库。该数据库将有一个单独的表，其中只包含您编写的功能的id（我假设mastermap有这些）。不知何故，您必须先将其设置为空，然后将writer设置为append。请确保此列也已编入索引，以便快速扫描它。然后在工作区的主要流程中，使用databasejoiner将每个mastermap特性连接到sqlite db——如果有匹配项，请不要将该特性写入geodb文件。如果不匹配，请将该功能写入geodb文件和ids的sqlite表。这是一个高层次的描述，但我希望它能让你去。您不必使用sqlite，但它似乎是一个很好的潜在选择。

哦，是的，并且b）确保你在workspace runner中一次只运行一个从工作区（同步运行），这样所看到的id的数据库保持健康并且能够被一致地查询-如果你有多个写入程序撞击到filegeodb中，那么你所写的内容的数据库将永远不正确。

Answer 2 · 2019-07-26T09:55:46Z

回答通过红学 ·7月26日上午9:55

你一次处理所有文件吗？这肯定会导致一些问题，具体取决于您在工作区中所做的操作以及内存/临时空间的情况。

我时不时地处理荷兰语top10nl gml集（90多个gml文件，总共解压了大约40ish-gb），只需将它们写入postgis数据库就需要大约2.5小时（我所做的唯一处理是删除一些属性，并将2个特征类型过滤为区域/行的单独表）

添加注释· 表演3· 分享

10 4000需要的字符剩余字符超过个字符

附件：最多可使用10个附件（包括图像），每个最大值为4 MB，总计为4 MB。

杰克朗斯代尔 ·7月26日上午9:58 0个

我试着同时处理所有的建议，任何最有效的方法，因为我不想在有15000个文件的时候手动选择一些

红学杰克朗斯代尔 ·7月26日上午10:21 0个

只要你的工作空间里没有任何阻塞变压器，它就应该一个接一个地处理它们。我不知道OS MasterMap是如何在内部设置的，一个对象是否可能被拆分成多个文件（映射表）？如果是这样的话，你把它们结合起来，就会对表演造成严重影响。

埃比戈姆红学 ·7月29日上午8:04 0个

当os mastermap作为geologicunks提供时，跨越边界的任何特征都会在两个网格中传递，因此需要进行一些后期处理。

15000 gml合并

2个答复

回答这个问题

相关问题