答案为“在PDF搜索字符串” https://knowledge.亚搏在线safe.com/questions/82270/search-string-in-pdf.html 对于这个问题“的PDF搜索字符串”的最新答案 通过idrispeiren1回答 https://knowledge.亚搏在线safe.com/answers/84522/view.html

嗨,我部署的所有数据的模型,我遇到了另一个问题。该FME模型停止出于某种原因,尽管“则会忽略失败读者”设置为“是”。

这里有什么建议?

伊德里斯

DSI_terreinen_in_planning_v6_stringsearch_categoriebedrijvigheid.fmw


周四,二零一八年十二月二十零日14点36分二十秒GMT idrispeiren1
通过redgeographics回答 https://knowledge.亚搏在线safe.com/answers/82340/view.html

出于某种原因,如果我插上在FeatureReader的网址,它不会工作,但如果我用一个HTTPCaller保存PDF的本地副本,然后打开使用FeatureReader它的工作。

pdf_searching.fmw

请注意,我强烈建议减速器。你会被击中每一次功能承载PDF web服务器,所以这是超过1700倍的数据集。如果你这样做,在FME的常规速度可能超载,或被视为DDOS攻击(我曾经做到这一点)。

你也很依赖于PDF是如何构成的。我已经用作样品的第一个似乎是一个相当不错的,但也不能保证他们都会这样。如果它是一个表格扫描你的运气了。

一个非常重要的参数是FeatureReader,确保在PDF参数有设置空间的文本之一“功能每块”。这样,它试图让每行一个文本对象。

周一,2018年11月12日9时16分33秒GMT redgeographics
通过idrispeiren回答 https://knowledge.亚搏在线safe.com/answers/82336/view.html

嗨冬青,

下面是表的截图:


对于表中的每个记录我要搜索一个指定的字符串(如bedrijvigheid)在属性 “Stedenbouwkundige voorschriften”(遗憾的ducth术语)。如果字符串在PDF一场比赛,我想保持这个纪录。一个范例文件被包括作为附件。Link_pdf.gdb.zip

周一,2018年11月12日8时34分04秒GMT idrispeiren