斯潘8
斯潘4
大家好,
我想到了regex编辑器和工作区运行结果之间的区别。
正如您在下面看到的,我希望为这个特性获得28个匹配项,这个特性的值写在测试字符串框的pdf_page_文本属性中。然而,字符串搜索器转换器不返回任何值。
有人知道造成这种情况的原因吗?
此regex似乎适用于您的文本:
([A-Z][])+,([A-Z]+[…])。+
所以…这里的大问题是这些换行符或回车符在您的PDF中吗?我猜是回车。
这是因为如果我使用attributeCreator设置您的数据(在这里按回车键会给我换行符)。然后,在我的搜索引擎中,它似乎工作得很好。
但是如果我手动将行尾标记改为回车,源看起来几乎相同,但StringSearcher找不到匹配项。
所以…这是一个猜测,但我认为,regex预览对话框使用换行符的方式与文本编辑对话框相同。
如果对源字符串进行了替换,将lf字符替换为cr,然后,StringSearcher应该(如果我是正确的)工作正常。
我会向开发人员询问这个问题。
我还应该提到,我在一个regex测试仪中试用了您的原始regex,它说这是“灾难性的”!真正地。很明显,这意味着它在找到你要找的绳子的地方可以很好地工作,但如果不是这样,它将开始在一个几乎永不结束的圆中循环迭代。这个博客解释了为什么(尽管我不得不说我不明白其中的一半!):https://www.regular-expressions.info/灾难性.html
谢谢你的回答。正如您所猜测的,问题在于回车。文本包含行尾的回车和换行符。因此,在字符串搜索器和原始regex工作之前,我用字符串替换器删除了回车。
然而,我坚持认为regex编辑器和运行时之间的区别存在问题。
我在写我的工作流程,这样你可以亚搏在线自己测试它,如果你愿意的话;
-我将数据转发到字符串搜索器之前的inspector transformer,打开pdf页面文本属性的值窗口并复制文本。
-然后我将它粘贴回regex编辑器测试字符串中,并对regex进行编码。据说有28场比赛。
-最后我把字符串搜索器变压器放在测试人员和检查人员之间。但它与任何东西都不匹配。
所以我从头到尾都在FME框架中,对同一个文本有两个不同的输出。
最后,对于我的原始Regex,我不是古鲁,可以改进。然而,我知道它不会造成任何灾难性的情况,因为我不使用任何量词,如+或*。如果我要查找的字符数超过20,它将停止匹配
?2019安全亚搏在线软件公司|合法的